MPEG 呼吁使用基于学习的视频编解码器,用于质量评估研究

在第 144 次 MPEG 会议上,MPEG 视觉质量评估(AG 5)发出呼吁,要求研究基于学习的视频编解码器的质量评估。AG 5 一直在对编码视频内容进行主观质量评估,并研究其与客观质量指标的相关性。这些研究大多集中在高效视频编码 (HEVC) 和多功能视频编码 (VVC) 标准上。MPEG 保留了用于研究质量指标(CVQM)的压缩视频数据集,供本研究使用。

鉴于最近在开发基于学习的视频压缩算法方面取得的进展,MPEG 研究了使用基于学习的编解码器进行压缩的问题。MPEG 预计,与传统的基于块的运动补偿视频编码设计所引起的失真相比,使用基于学习的编解码器压缩后的重建视频会出现不同类型的失真。为了更深入地了解这些失真及其对视觉质量的影响,MPEG 公开征集基于学习的视频编解码器,用于质量评估研究。MPEG 欢迎大家响应号召,提供意见和建议。MPEG 将在对回应进行评估后,邀请符合要求的回应者提交压缩比特流,以便进一步研究其主观质量和纳入 CVQM 数据集的可能性。

鉴于基于学习的视频压缩算法的发展日新月异,MPEG 将继续开放这项征集活动,并期待今后对征集活动进行更新。

请感兴趣的各方联系 MPEG AG 5 召集人 Mathias Wien (wien@lfb.rwth-aachen.de) 并提交回复,以供 2024 年 1 月召开的第 145 次 MPEG 会议审查。更多详情请参见作为 AG 5 N 104 号文件发布的征集令,可从 mpeg.org 网站获取。

MPEG 评估 “机器视频编码特征压缩 “提案征集

在第 144 次 MPEG 会议上,MPEG 技术要求 (WG 2) 评估了 “机器视频编码的特征压缩”(FCVCM)提案征集 (CfP) 的答复。机器视频编码的特征压缩 “研究了针对神经网络中遇到的中间 “特征 “进行压缩的技术,使神经网络的分布式执行等用例成为可能。这与机器视频编码(Video Coding for Machines)形成鲜明对比,后者压缩传统视频数据,但针对解码视频的机器消费而非人类消费进行优化。

根据本 CfP 收到的 12 份答复,FCVCM 的整体流程可分为两个阶段:(1) 特征还原和 (2) 特征编码。与特征缩减相关的技术包括(但不限于)基于神经网络的特征融合、时间和空间重采样以及自适应特征截断。与特征编码相关的技术包括基于学习的编解码器、基于块的外部视频编解码器和混合编解码器。

所有响应都在四个数据集的三个任务中进行了评估。结果显示,以平均比约特加德-Δ(BD)率衡量,针对特征锚点的整体增益高达 94%,针对视觉锚点的整体增益高达 69%。第 2 工作组提出的所有要求都在不同的提案中得到了满足,测试模型也已确定。

鉴于此次呼吁的成功,MPEG 将继续研究用于机器视觉的视频特征压缩方法。MPEG 视频编码(第 4 工作组)将继续开展这项工作,并将启动一个新的标准化项目,计划于 2025 年 7 月完成并达到国际标准最终草案 (FDIS) 的状态。

第 2 工作组感谢对 CfP 提交答复的支持者和测试管理员。MPEG 将继续收集和征求反馈意见,以便在接下来的会议中改进测试模型。

MPEG 制定了用于网络抽象层视频数据传输的 ISOBMFF 相关标准

在第 144 届 MPEG 会议上,MPEG 系统(第 3 工作组)推进了各种 ISO 基本媒体文件格式 (ISOBMFF) 相关标准的制定工作。

作为 ISOBMFF 相关标准系列的一部分,ISO/IEC 14496-15 定义了网络抽象层 (NAL) 单元结构视频数据的传输,如高级视频编码 (AVC)、高效视频编码 (HEVC)、多功能视频编码 (VVC)、基本视频编码 (EVC) 和低复杂度增强视频编码 (LCEVC)。ISO/IEC 14496-15 通过增加对增强功能的支持得到了进一步改进,如 VVC 特别支持的画中画(PiP)用例,最终批准了最终修正草案(FDAM)。此外,单独制定的修正案已合并到第 7 版 ISO/IEC 14496-15 中,该版本已晋升为国际标准最终草案(FDIS),这是标准制定的最后一个里程碑。

与此同时,ISO/IEC14496-32(文件格式参考软件和一致性)第二版已晋升为委员会草案(CD),这是标准制定的第一阶段,计划于 2025 年初完成并达到国际标准最终草案(FDIS)的状态。该标准对于需要可靠的标准化方法来验证其实施的一致性的行业专业人士来说至关重要。

MPEG 加强对节能媒体消费的支持

在第 144 次 MPEG 会议上,MPEG 系统(第 3 工作组)将 ISO/IEC 23001-11 第 1 修正案(基本视频编码 (EVC) 的节能媒体消耗(绿色元数据))提升为最终修正案草案 (FDAM),这是该标准制定的最后一个里程碑。这项最新修订定义了元数据,可降低 ISO/IEC 23094-1(基本视频编码(EVC))解码器的功耗。

与此同时,ISO/IEC 23001-11 第 2 项修正案(用于降低新显示功耗元数据的高能效媒体消耗)已晋升为委员会修正案草案(CDAM),这是标准制定的第一阶段。该修正案引入了一种新的方式,将有关降低显示功耗的元数据作为视频基本流与其描述的视频交错编码。预计该修正案将于 2025 年初完成,并达到最终修正案草案 (FDAM) 的状态。这些发展标志着向更节能的媒体消费和更可持续的未来迈出了重要一步。

MPEG 批准支持基于几何的点云压缩的时间可扩展性

在第 144 次 MPEG 会议上,MPEG 系统(第 3 工作组)将 ISO/IEC 23090-18 第 1 修正案(支持时间可扩展性)提升至最终修正案草案 (FDAM),即标准制定的最后阶段。该修正案允许使用 ISO/IEC 23090-9 压缩点云数据的单个基本流,并将其存储在基于 ISO 基本媒体文件格式 (ISOBMFF) 的多个轨道文件中,从而支持需要在单个文件中使用多帧速率的应用。修正案引入了音轨分组机制,以分别显示携带单个基本流的特定时间层的多个音轨。考虑到适合特定应用的帧频,该标准还提供了从存储在多个轨道中的数据重建单个基本流的信息。

MPEG 达到 3D 图形格式交换的第一个里程碑

在第 144 次 MPEG 会议上,MPEG 3D 图形和触觉编码(第 7 工作组)将 ISO/IEC 23090-28(用于基于渲染的系统和应用的高效 3D 图形媒体表示法)提升为委员会草案(CD),这是标准制定的第一阶段。该标准旨在简化三维图形格式的交换。它主要解决了在多个渲染平台上,glTF、USD、ITMF 等流行三维格式之间进行一致资产交换的难题。例如,由于现有的交换限制,一个 glTF 场景在不同的渲染器或播放器上的渲染效果可能不尽相同。ISO/IEC 23090-28 引入了一个全面的元数据词汇表,旨在确保 Unity Technologies 和虚幻引擎等平台上流行的 3D 模型格式之间的兼容性,从而解决这一问题。该标准规定了该标准的初始映射,首先是将 ISO/IEC 23090-28 元数据与 glTF2.0 规范(最近被认定为 ISO/IEC 12113)保持一致。该标准计划于 2025 年初完成,即达到国际标准最终草案(FDIS)的状态。

MPEG 宣布完成基因组注释的编码工作

在第 144 次 MPEG 会议上,MPEG 基因组编码(第 8 工作组)宣布完成 ISO/IEC 23092-6(基因组注释编码)。该标准满足了提供与原始测序数据和元数据压缩表示相关联的基因组注释压缩表示的需求。

ISO/IEC 23092-6 是对现有 MPEG 基因组学标准的补充,不仅包含一级(原始测序数据)和二级(配准测序数据)基因组数据,还包含三级基因组数据,包括变异调用、基因表达、映射统计、接触矩阵(如 Hi-C)、基因组轨迹信息和功能注释,在 ISO/IEC 23092 系列标准中统称为注释数据,并具有高效的压缩、索引和搜索功能。ISO/IEC 23092-6 中规定的格式还包括一些高级功能,如数据的选择性加密和签名、审计支持、数据来源信息、可追溯性,以及支持直接链接到以通用标准格式表达的外部临床数据存储库。

作者:OTTVerse
译自:https://ottverse.com/mpeg-issues-call-for-learning-based-video-codecs/

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/37720.html

(0)

相关推荐

发表回复

登录后才能评论