2026 年 WebRTC 五大预测：Tsahi Levent-Levi 谈 AV1、MOQ 以及可能出现的问题

本文分享内容来自 webrtc.ventures 首席执行官 Arin Sime 和 WebRTC 行业资深权威人士、 BlogGeek.me 的 Tsahi Levent-Levi 进行的对话内容。通过 5 个问题预测实时视频在未来一年及更长时间内的发展方向。

本文将为您清晰梳理这五大预测，包括：

开发者会更抱怨 WebRTC 还是 MOQ？
AV1 能否在 2026 年成为主流视频编解码器？
WebRTC 边缘计算是炒作还是实质性突破
Tsahi 认为可能颠覆 WebRTC 的黑马技术
哪些当前“最佳实践”可能很快被视为反模式

让我们深入解析 Tsahi 的预测及其对 2026 年 WebRTC 发展方向的启示。您也可在YouTube观看《2026年五大WebRTC预测》视频。

预测 1：WebRTC还是MOQ——2026年谁将承受更多抱怨？

Arin 开篇抛出一个有趣的问题：到 2026 年，开发者会对 WebRTC 还是 MOQ 抱怨更多？

Tsahi 毫不犹豫地回答：“WebRTC。”

为何 WebRTC 将比 MOQ 承受更多批评

如今，MOQ 仍属于早期采用者领域。当前使用者包括：

热衷实验的探索者
认同发展方向的拥趸
少数能指出缺陷却仍积极参与的尖锐批评者

正如 Tsahi 所言，现阶段的 MOQ 用户群体由“深爱它”和“为它赴死”的人构成。偶尔会听到质疑之声，比如有人认为其发展方向有误，但这类声音属于极少数。

还有一个关键细节：最小起订量标准和工具尚未完全确定。它们并非一成不变，变更在所难免。这使得用户持有不同的心态。如果出现问题或变更，他们会将其视为流程的一部分。正如 Tsahi 所说，只要产品尚未达到量产标准，标准仍在不断变化，又何必抱怨呢？

WebRTC 目前处于截然不同的阶段：

它已成熟并广泛部署。
它在实际生产环境中运行
许多团队都依赖它来运行业务关键系统。

这使得人们的期望值更高。一旦出现问题或表现不佳，抱怨声也会更大。

随着 MOQ 的应用范围从现有用户扩展到更广泛的工程团队，越来越多的开发者会遇到实际问题。届时，抱怨声也会随之而来。但 Tsahi 预计，对于 WebRTC 2026 而言，WebRTC 仍将是开发者最头疼的问题所在，原因很简单，它覆盖面广且历史悠久。

预测 2：AV1 会在 2026 年成为主流视频编解码器吗？

第二个问题是关于视频编解码器：AV1能否在 2026 年成为主流编解码器？

Tsahi 的回答再次很明确：“不。”

他还补充了一个时间表：如果 AV1 成为主流，那可能要到 2028 年左右，而不是 2026 年。

为什么 AV1 不会在 2026 年 WebRTC 中占据主导地位

AV1 已经投入使用，而且很多人都喜欢它。在某些情况下，它可以提供更好的压缩率和更高的画质。问题不在于用户兴趣，而在于 CPU 占用率。

目前的 AV1：

对于许多实际应用场景来说，CPU占用率过高
仅适用于处理预算和硬件条件允许的情况。
对于大多数产品而言，这不是默认选项。

与此同时，VP8 仍然“开箱即用”。它拥有广泛的支持、稳定性强且易于运行。如果产品已经在使用 VP8，那么切换到 AV1 并非易事。这需要大量的工程投入、测试和调优。

Tsahi 的逻辑很简单：

两年后，VP8 仍然能够正常工作。
如果旧系统运行良好，它们将继续使用 VP8 或 H.264 。
尽管 VP9 已经存在多年，但许多服务仍然没有完全采用它。

根据这种模式，他预计 AV1 在中期内将遵循类似的路径：在合适的地方使用，但在 2026 年不会在 WebRTC 中占据主导地位。

以下是 Tsahi 对当前编解码器组合的简要概述：

编解码器	现在处于什么位置？	主要优点	主要缺点
VP8	许多新旧 WebRTC 服务	稳定、易于理解、“开箱即用”	效率低于新型编解码器
H.264	传统系统、摄像头、互操作案例	广泛的设备支持	许可，旧格式
VP9	选择服务和实验	比VP8压缩效果更好	采用率仍然有限
AV1	新项目，受控环境	强大的压缩潜力	CPU占用率高，目前还不能即插即用。

Tsahi 预计 WebRTC 2026 中 AV1 的使用量将会增长，但 VP8 和 H.264 仍将是许多服务的主力军。

预测 3：WebRTC的边缘计算是炒作还是真正的进步？

接下来是一个备受关注的趋势：WebRTC 的边缘计算。

Arin 将其描述为 WebRTC 在“边缘”运行，例如：

物联网设备和传感器
安全监控摄像头
可穿戴设备和增强现实技术的工厂工人
无人机和远程设备监控

那么，2026年会是边缘计算蓬勃发展的一年吗？Tsahi 的回答是：未必。

边缘计算：增长缓慢且应用场景小众

Tsahi 认为，WebRTC 边缘计算将继续缓慢增长，与它迄今为止的增长方式类似。用他的话说，与近年来相比，“不会有真正有趣或令人兴奋的变化”。

最大的原因是历史遗留问题和惯性，尤其是在监控和安全领域。

目前大多数监控摄像头：

仍然使用 H.264 编码视频
通过 RTSP 协议进行流媒体传输
拥有庞大的用户群，而且运行良好。

为什么他们会一直这样下去？原因还是“因为这样行得通”。

如果服务提供商想要将这些摄像头集成到 WebRTC 应用中，复杂性就会转移到服务器端。他们从摄像头获取 RTSP 流，然后将其转换或通过网关传输为 WebRTC 格式，供浏览器或应用程序使用。这样，摄像头供应商可以保留其现有的技术栈，而云服务提供商则承担集成方面的开销。

从相机制造商的角度来看，有一个很明确的问题：如果客户可以在自己的服务器上绕过 WebRTC，那么为什么要投资将 WebRTC 直接集成到相机中呢？

因此，Tsahi 预计：

WebRTC 边缘计算技术将主要出现在新设备上，而不是旧设备上。
WebRTC 的应用将首先在能够带来显著价值的特定领域展开。

他以无人机为例，说明在无人机上使用 WebRTC 比在普通监控摄像头上使用更合适。无人机通常需要低延迟、双向控制和灵活的信号传输，而这些正是 WebRTC 的优势所在。

因此，对于 WebRTC 2026 而言，边缘计算的应用将会出现，但规模有限。它将在少数特定垂直领域因需求而发展，而不是成为物联网和摄像头硬件领域普遍采用的趋势。

预测 4：可能颠覆 WebRTC 的黑马技术

当被问及有哪些黑马技术可能会以意想不到的方式颠覆 WebRTC 时，Tsahi 的选择是：MOQ。

他将此与更广泛的Web技术栈联系起来：

WebCodecs
WebTransport
WebAssembly

Tsahi 建议将这些功能结合起来，并使用 MOQ 代替 WebTransport，可以有效地实现新型的实时体验。

是什么让 MOQ 如此有趣？

通过组合这些构建模块，开发人员可以：

构建无需完全遵循 WebRTC 模型的媒体管道
以使用原生 WebRTC 更难实现的方式进行区分
尝试使用 WebRTC 更为严格的功能。

主流开发者不会在一夜之间就接受这种模式。Tsahi 预计，一些“疯狂的创业公司”以及大型、极具竞争力的供应商将率先推动这种模式。

他点名提到了几位可能的早期采用者：

Google Meet
Zoom
Microsoft Teams
Cisco Webex

如果定制媒体堆栈和定制网络逻辑能够给这些公司带来真正的竞争优势，那么它们完全有能力进行投资。

这里仍然存在疑问。Tsahi 指出，Zoom 之前也走过类似的道路，但在 2024 年底放弃了这种做法。他们或其他公司是否会在 2026 年或 2027 年重新采用这种模式，目前尚不得而知。

即便如此，对他来说，MOQ 与 WebCodecs、WebTransport 和 WebAssembly 相结合，最有可能成为未来几年颠覆我们对 WebRTC 认知方式的黑马。

预测 5：当前 WebRTC“最佳实践”可能变成反模式

最后一个问题是关于目前流行的 WebRTC 实践，但这些实践可能很快就会看起来像是糟糕的想法，甚至是反模式。

Tsahi 列举了两个主要区域：

Simulcast 被过度滥用
可扩展视频编码（SVC）始终未能兑现承诺

他还将此与一个更深层次的问题联系起来：当基于人工智能的图像放大技术发展如此迅速时，我们应该在多大程度上继续追求新的编解码器和更高的分辨率？

Simulcast：强大的工具，但在常见情况下却被滥用

Simulcast 通常被推荐为群组通话的必备功能。它可以发送同一视频的多个不同比特率和分辨率版本，以便媒体服务器可以为每位参与者选择最佳版本。

Tsahi 同意 Simulcast 是一个强大的工具，但他补充道：“Simulcast 很棒，但不要在所有情况下都使用同它。”

问题的核心在于：

即使系统支持群组通话，许多服务中的大多数通话仍然是一对一的。
如果两个人在一个技术上属于群组房间的房间里说话，Simulcast 仍然会启动。
在这种简单的情况下，Simulcast 只会消耗额外的带宽和 CPU，而不会增加实际价值。

他的观点是，我们需要完善最佳实践：

在有助于实现 Simulcast 的场合使用，例如真正的多方会议。
如果是 1 对 1 通话，或者布局简单的小型群组通话，则可以跳过此功能。
将其视为一种条件性工具，而不是通用默认值。

对于 WebRTC 2026 来说，这种过度使用可能会开始看起来像是一种反模式，因为越来越多的团队会衡量成本并仔细优化。

SVC：人们期待已久却始终未能实现的“圣杯”

可伸缩视频编码 (SVC) 近十年来一直被誉为“圣杯”，尤其是在 VP9 出现之后。理论上，SVC 允许你对视频进行一次编码，其中包含多个质量层，然后根据网络状况和设备性能平滑地进行调整。

但实践中，Tsahi 的观点直截了当：它至今仍未实现。

他提出的问题：

SVC 能否随着 AV1 的普及而最终得到实际应用？
或者它会一直停留在人人都在谈论，但真正实践的人却寥寥无几的阶段？

他倾向于持怀疑态度，至少在短期内如此。SVC 可能永远只是“纸上谈兵”的美好构想，很少能成为实际部署的核心部分，尤其是在更简单的方法已经足够有效的情况下。

我们是否在追求错误的方向：编解码器和 4K 与 AI 升频？

从 Simulcast 和 SVC 开始，Tsahi 的思考更加广泛，这对 WebRTC 2026 及以后的发展意义重大。

多年来，该行业一直：

追逐下一个最佳视频编解码器
力推更高分辨率，例如 4K

但在实际通话中，我们经常：

口口声声说着高清，实际上却发来 VGA 或 720p 的视频。
在笔记本电脑的小窗口模式下工作，4K 分辨率对感知画质的提升并不明显。

Tsahi 举了一个他自己录制的视频中的例子，其中很多视频都是竖屏拍摄的：

他应该用 1080p 还是 720p 录制？
他真的想为 5 分钟的内容存储 1 GB 的空间吗？200-300 MB 可能就足够了。

这些是离线视频，对视频质量的要求比实时通话更高。即便如此，这种权衡取舍也并不明显。

然后他提到了 YouTube 最近推出的一项功能，这项基于人工智能的超分辨率技术，他称之为“超高清”。有了这项功能，你可以上传低分辨率视频，YouTube 会利用人工智能技术将其放大，让观众看到接近高清的画质。

这就引出了一个大问题：如果人工智能能够如此出色地提升视频分辨率，我们是否仍然需要始终发送和存储全高清或 4K 视频？

Tsahi 是这样描述这一选择的：

我们是否应该投入精力来提高发送端的视频压缩技术？
或者我们应该投资开发接收端的更先进的人工智能，以改善接收到的任何信息？

他承认，自己目前还不清楚一两年后最佳实践会是什么样子。而正是这种不确定性，使得今天的一些习惯很快就会显得糟糕。

以下是对他所暗示的权衡取舍的简单比较：

方法	优点	缺点
存储高分辨率	最大限度保留了原有品质	文件越大，存储空间和成本就越高。
AI 提升播放画质	文件更小，播放更灵活	额外加工，质量可能有所不同

对于正在规划 WebRTC 2026 的团队来说，这意味着一些长期以来的假设可能需要重新审视。“永远追求更高分辨率、永远追求更新的编解码器”这种思维模式可能会逐渐消失，取而代之的是更加平衡的选择，这些选择会考虑到人工智能和用户的实际需求。

总结：WebRTC 2026 的真实面貌会是什么样的？

Tsahi 与 Arin 的快速对话描绘了 WebRTC 2026 的图景，与其说是剧烈的变革，不如说是稳步的改变。

要点总结：

对 WebRTC 的抱怨比对 MOQ 的抱怨更多，因为 WebRTC 出现得更早，应用更广泛，而 MOQ 目前仍处于早期采用者阶段。
AV1 在 2026 年不会成为主流编解码器，可能需要到 2028 年左右才能达到这一地位，而 VP8 和 H.264 仍将保持强劲势头。
Edge WebRTC 将缓慢发展，在无人机和新设备等小众领域得到实际应用，而传统摄像机仍将坚持使用 H.264 和 RTSP。
MOQ 加上 WebCodecs、WebTransport 和 WebAssembly 是 Tsahi 认为的黑马技术栈，从长远来看可能会颠覆传统的 WebRTC。
Simulcast 过度使用和 SVC 炒作可能会变成公认的反模式，尤其是在 AI 放大技术改变我们对分辨率和编解码器的看法之后。

真正的考验将在2026年到来之际。哪些预测最终会成为现实，哪些又会出乎我们的意料？无论如何，这些问题对于任何计划在WebRTC领域采取下一步行动的人来说，都是有益的指导。