众所周知,FFmpeg 开发人员通过手工优化的汇编代码,特别是围绕英特尔/AMD AVX-512 对这个广泛使用的开源多媒体库的各种功能进行的优化,实现了非常惊人的性能提升。本周合并的项目是增强 Bwdif 去隔行扫描视频滤镜,在使用 AVX-512 时,速度比基本 C 代码路径快 23~28 倍。
Niklas Haas 为 Bob Weaver 去隔行视频滤镜“vf_bwdif”实现了 AVX-512 实现,使其能够支持具有高级矢量扩展 512 功能的较新的英特尔和 AMD 处理器。
与未经优化和非常基本的 C 基线相比,bwdif8_avx512 快 23.28 倍,bwdif10_avx512 快 28.27 倍。或者说,与现有的 AVX2 实现相比,速度几乎提高了两倍。

这适用于英特尔/AMD AVX-512 处理器,但也有限制,以防止在 Skylake 处理器上使用,因为 Skylake 处理器的 AVX-512 实现声名狼藉,存在散热/功耗问题,进而导致 CPU 降频。
新的 AVX-512 实现已在几周后发布的 FFmpeg 8.0 之前合并。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/60371.html