多年来,RTMP 和 SRT 一直是直播领域的主力。但随着人们对更低延迟和更多互动体验的不懈追求,新的领军者正在崛起。WHIP(WebRTC-HTTP Ingestion Protocol)和 MoQ(Media over QUIC)——这两种协议有望以更高的效率和现代化的架构实现毫秒级延迟,从而重新定义实时流媒体。
如果您的业务涉及现场直播、互动游戏、实时拍卖或任何毫秒必争的应用,那么是时候关注一下了。让我们来分析一下为什么这些后起之秀会在速度方面让前辈们望尘莫及。
老派协议:可靠但已显老态
RTMP(实时消息传输协议): 由 Adobe 开发的 RTMP 曾经是无可争议的王者,为 Flash 时代提供了动力。与传统的基于 HTTP 的流媒体(如标准形式的 HLS/DASH)相比,RTMP 以其相对较低的延迟而著称,目前仍广泛用于流媒体摄取,将流从编码器发送到媒体服务器。不过,RTMP 是建立在 TCP(传输控制协议)基础上的。虽然 TCP 可通过重传丢失的数据包来确保可靠的传输,但这种机制也会带来延迟,尤其是在不稳定的网络上。这就是所谓的 “队头阻塞”,一个丢失的数据包就可能导致整个数据流中断。此外,RTMP 对现代编解码器的支持有限,其播放能力也随着 Flash 的消亡而减弱。
SRT(安全可靠传输):SRT 的诞生是为了克服 RTMP 在高难度网络上的局限性,它向前迈出了重要的一步。它是一个开源协议,使用 UDP(用户数据报协议)进行传输,但添加了自己的传输层以提高可靠性,包括用于数据包恢复的 ARQ(自动重传请求)机制。这使得 SRT 能够提供高质量、稳定的流媒体,并且比 RTMP 的延迟更低,尤其是在网络连接不稳定的情况下。SRT 非常适合用于贡献内容和许多广播场景。
虽然 SRT 提供了显著的改进,但对超低延迟(毫秒级)和更高效的 Web 原生解决方案的追求仍在继续。
新的挑战者:WHIP 和 MoQ ,为速度和现代网络而生
这就是 WHIP 和 MoQ 发挥作用的地方,它们利用了网络通信领域的最新进展。
WHIP:摄取的快速通道
想象一下,将 WebRTC 的超低延迟功能轻松融入您的流媒体工作流程。这就是 WHIP。
- 它是什么:WHIP 于 2025 年 3 月由 IETF 标准化为 RFC 9725,它提供了一种简单的基于 HTTP 的信令机制来启动 WebRTC 会话以进行媒体提取。
- 如何实现低延迟: WHIP 本身并非媒体协议,WebRTC 才是。WebRTC 从一开始就专为实现实时、毫秒级延迟通信而设计。它基于 UDP 运行,并融合了先进的拥塞控制和快速自适应技术。WHIP 只是让将 WebRTC 源(例如编码器或浏览器)连接到支持 WHIP 的媒体服务器或 CDN 变得更加容易。
- 相较于 RTMP/SRT 的低延迟优势:
- 真正的毫秒级延迟:直接利用 WebRTC 经过验证的功能。
- 简化的 WebRTC:无需通常与 WebRTC 相关的复杂自定义信令服务器。
- 现代编解码器友好:支持 WebRTC 固有的编解码器,如用于音频的 Opus 和用于视频的 VP9/AV1,提供比 RTMP 常用的旧编解码器更好的质量和效率。
- 防火墙穿越:使用标准 HTTP/S 进行信令,并依赖 WebRTC 的 ICE、STUN 和 TURN 进行 NAT 穿越,通常使其对防火墙友好。
WHIP 在摄取方面正在迅速获得关注,它允许广播公司和平台轻松采用 WebRTC 的速度优势,而无需进行大量的集成。
MoQ:下一代全能型技术
如果说 WHIP 是摄取领域的专业短跑运动员,那么 MoQ 则致力于成为摄取和广泛媒体传输领域的多才多艺的下一代十项全能运动员。
- 简介:MoQ 是一种新兴的传输协议,目前正由 IETF MoQ 工作组积极开发(截至 2025 年 5 月)。它旨在通过 QUIC 直接发送媒体(音频、视频、定时元数据)。
- 如何实现低延迟: QUIC(本身基于 UDP 构建)是实现低延迟的关键。QUIC 由 Google 开发,是 HTTP/3 的基础,它具有诸多优势:
- 更快的连接建立:减少建立连接所需的往返次数。
- 减少队头阻塞: QUIC 流是独立的。如果一个数据流丢失了数据包,它不会阻塞其他数据流,这比 TCP 有了显著的改进。
- 改进的拥塞控制:更先进的算法可以更好地应对不断变化的网络条件。
- 连接迁移:即使用户的 IP 地址发生变化(例如从 Wi-Fi 切换到蜂窝网络),也允许连接持续存在。
- 内置加密:所有 QUIC 连接均默认加密(TLS 1.3)。MoQ 充分利用了 QUIC 的这些优势,专注于媒体传输,旨在实现高效、可扩展且超低延迟的交付。其设计还充分考虑了 WebTransport 的特性,支持浏览器到服务器的直接媒体流。
- 相较于 RTMP/SRT 的低延迟优势:
- QUIC 的固有速度: QUIC 的所有优势都直接转化为媒体传输。
- 弹性和效率:比基于 TCP 的 RTMP 更好地处理数据包丢失和网络变化,并且可能比 SRT 更精简以 Web 为中心的交付。
- 多路复用能力:通过单一连接有效处理多个媒体轨道和数据流。
- 一对多的可扩展性:旨在有效地将实时流分发给大量受众。
- 面向未来的基础:建立在尖端的网络传输协议(QUIC、HTTP/3、WebTransport)之上。
MoQ 仍在不断发展,但它代表了对现代互联网媒体传输的根本性重新思考,有望为广泛的低延迟应用提供统一的解决方案。
为什么 WHIP 和 MoQ 能在延迟竞赛中胜出
- 专为毫秒级设计:与 RTMP(通常为 1-5 秒)或优化的 SRT(可以是毫秒级,但通常会调整可靠性,这可能会稍微增加延迟)不同,WebRTC(WHIP 使用)和 QUIC(MoQ 使用)的目标是亚 500 毫秒延迟,而且通常要低得多。
- UDP 为核心,智能管理:两者均利用 UDP,避免了 TCP 固有的延迟隐患,例如队头阻塞。虽然 SRT 也使用 UDP,但 WebRTC 和 QUIC 拥有更成熟、更完善的拥塞控制、错误恢复机制(例如 WebRTC 的 NACK/FEC 和 QUIC 的丢失检测与重传),以及专为实时交互量身定制的流管理机制。
- 现代编解码器效率:它们与现代高效编解码器(AV1、VP9、HEVC、Opus)更加一致,这意味着在较低比特率下实现更好的质量,减少数据负载并进一步有助于降低延迟。
- 简化集成与标准化: WHIP 为 WebRTC 采集提供了亟需的标准。MoQ 旨在创建一个更全面、更简单的 QUIC 媒体传输标准,从长远来看,有望降低复杂性。
- 浏览器原生潜力: WebRTC 原生于浏览器。MoQ 可以利用的 WebTransport 为浏览器提供了一个现代化、低延迟、双向通信的 API。这种直接集成对于最大限度地降低网页播放的延迟至关重要。
游戏现状(2025 年 5 月)
- WHIP:已获得拟议标准 (RFC 9725)。其采用率正在稳步增长,许多编码器(硬件和软件)和媒体服务器平台(例如 Dolby.io、Cloudflare、Red5 Pro、Wowza)都提供 WHIP 摄取支持。WHIP 正成为将 WebRTC 的低延迟特性引入专业流媒体工作流程的首选方案。
- MoQ:这是一个活跃的 IETF 工作组,目前正在起草规范。虽然尚未最终确定标准,但业界对此非常感兴趣,并且已出现一些早期实施案例。一些公司正在尝试使用 MoQ 实现端到端低延迟交付,其进展备受关注。
未来很快
虽然 RTMP 由于其现有的用户群,在视频领域仍将持续一段或久远时间,而 SRT 仍将是复杂网络环境下可靠贡献的有力选择,但其发展轨迹已清晰可见。对于要求最低延迟、无缝 Web 集成和面向未来的架构的应用,WHIP 和 MoQ 将处于领先地位。
WHIP 现已推出,简化了超低延迟的采集。MoQ 即将问世,有望为下一代 Web 传输方式带来革命性的媒体交付方式。如果您的流媒体传输速度至关重要,那么现在是时候开始探索这些强大的新协议了。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/58212.html