随着超高清(UHD)、高动态范围(HDR)、体育赛事直播、沉浸式音频乃至 8K 技术的应用日益普及,编码已成为一项核心业务战略。广播公司和流媒体服务提供商必须在提升观众体验的同时,降低带宽和基础设施成本。
AI 驱动的优化技术、内容感知编码以及新一代编解码器的进步,使运营商能够以更低的码率提供更高质量的视频,这从根本上重塑了优质视频体验的传输方式。
将编码作为战略业务驱动力
每增加 1 兆比特每秒都会产生成本,包括 CDN 费用、传输、存储和处理能力。在规模化运营中,即使微小的码率降低也能转化为可观的运营成本节约。反之,视频画质的任何肉眼可见的下降都可能导致用户流失,特别是在当今竞争激烈的市场中,观众可以瞬间切换服务。
这一挑战本身就非常复杂。服务提供商必须同时优化三个压缩变量:视频质量、码率效率/处理能力以及延迟。一个领域的改进往往会影响另一个领域。例如,降低延迟可能会以牺牲码率效率为代价;在保持低码率的同时提升视频质量可能会增加计算负载;而添加沉浸式格式则会增加整个管道的复杂性。
现代编码策略将压缩视为整体传输策略的一部分,而不仅仅是一个编解码器设置。
AI 与机器学习编码创新的兴起
近年来最重要的编码发展之一,是将机器学习融入编码工作流。若干关键改进使广播公司和服务提供商能够提供更高的视频质量、更低的延迟和更高的效率。
内容感知编码作为一项先进技术,内容感知编码能够识别视频内容中视觉上重要的区域。例如人脸、文字叠加层或草地等高细节纹理,并优先提升这些区域的感知质量(图1)。与将每一帧一视同仁的做法不同,内容感知编码会实时分析内容特征,并将比特分配给最重要的区域。
对画质要求较低的区域分配较少的比特,在保持观众满意度的同时,有效节约了整体带宽。先进的码率控制算法可显著降低比特率,在某些情况下甚至能降低高达 50%,且不会造成肉眼可见的画质损失。

实时 VMAF 预测
当今先进的编码解决方案能够在实时编码过程中估算视频多方法评估融合(VMAF)等感知质量指标,从而使服务提供商能够在潜在质量下降影响观众之前及时发现。实时 VMAF 预测模型与离线测量结果的相关性高达 95%,这使得在实时工作流中能够进行准确的质量评估,并提前调整编码参数。
自动化质量分析
将 AI 融入质量监控,使服务提供商从被动故障排除转变为主动质量管理。基于 AI 的回归测试和自动化质量分析通过识别夜间和每周测试流中的偏差,从而提高可靠性。其结果是构建了一个更具韧性的编码管道,其中质量得到持续优化。服务提供商因此能够以更低的比特率提供更好的感知质量,从而降低分发成本。
智能节点重平衡采用
AI 驱动的算法,评估系统负载、内容复杂性和处理需求,从而指导动态节点重平衡。这种编码方式能够实现更一致的资源分配,并在分布式部署中保持稳定的视频质量。
GPU 增强
功能在下一代编码中发挥着至关重要的作用。通过将 AI 驱动的预处理(例如超缩放、降噪或反交错)和 GPU 支持的编码控制(例如将细粒度的量化参数 -QP- 控制集成到 GPU 管道中),现代编码平台可以显著提升性能和效率。
为下一代编解码器做好准备
虽然 AI 优化技术提升了现有标准下的编码效率,但广播公司和服务提供商也必须为下一代编解码器做好工作流程和基础设施的准备。
多功能视频编码 (VVC) 承诺在保持卓越视觉质量的同时,比 HEVC 节省高达 50% 的比特率,并且是 DTV+ 等下一代广播标准的首选编解码器。AV1 一直以来都被宣传为一种免版税的编解码器替代方案,如今凭借其优于传统编解码器的效率,在 OTT 生态系统中持续获得发展动力。而低复杂度增强视频编码 (LCEVC) 则提供了一个可扩展的增强层,可以在无需完全替换编解码器的情况下提高压缩效率。
音频编解码器的创新进一步拓展了现代编码平台的应用范围。MPEG-H 和 Dolby AC-4 等基于对象的格式能够实现沉浸式、个性化的体验。对话分离和辅助功能使广播公司和服务提供商能够为受众提供个性化的音频体验。此外,MPEG-H 和 AC-4 对基于对象的元数据的支持,实现了精准的音频渲染和个性化。
为了适应所有这些变化,编码的关键战略考量在于灵活性。广播公司和服务提供商无法承受每隔几年就进行一次破坏性的大规模基础设施更换。可扩展的编码管道,能够支持多种编解码器、基础层和增强层,可以实现与市场和业务需求相符的渐进式过渡。
以高密度、低延迟和沉浸式体验赋能下一代视频
提供下一代视频体验要求广播公司和服务提供商精准可靠地处理高强度工作负载。先进的编码架构旨在实现高密度和容错性能。这反过来又为更高分辨率、更低延迟、沉浸式格式和新兴观看体验奠定了基础。
某些应用,例如体育赛事直播,凸显了高性能编码架构的重要性。例如,体育赛事直播和互动应用需要高质量和低延迟。优化的传输管道可以在保持压缩效率的同时,降低端到端延迟。这对于游戏集成、同步第二屏幕体验和社交互动至关重要。
与此同时,8K 和沉浸式视频格式的实验正在加速进行。像 Harmonic 这样的编码技术提供商正在试验从 8K 源流中提取的 OTT 配置文件阶梯,这些阶梯在云端使用 CPU 和 GPU 资源进行处理。图 2 中展示的配置文件阶梯就是在云端处理的,这在两年前是成本高昂的。 这些试验表明,行业正在朝着通过混合计算架构高效交付更高分辨率的方向发展。

即使 8K 在短期内仍属于小众技术,但其背后的工程技术进步,如高密度处理、可扩展的云原生工作流程和无错误的多配置文件生成为空间计算、VR 和基于头戴式设备的体验奠定了基础。
新的压缩趋势
最终,最新的编码创新使广播公司和服务提供商能够在降低成本的同时,以更低的比特率提供更高质量的视频。内容感知编码、AI 的进步以及新兴的编解码器都在帮助服务提供商以最高效率提供优质体验方面发挥着重要作用。
在用户流失率高、成本削减和观众期望值不断提高的时代,视频压缩仍然是一项战略要务。将编码视为核心优先事项的服务提供商,将在视频发展的下一阶段占据更有利的地位。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/66151.html