

编解码认证作者
-
AVS3音频编解码标准在体育赛事直播中的应用实践
写在前面:人类对于声音的追求似乎永无止尽,从最初的无声电影,到如今具有沉浸式体验的三维声技术,每一次的技术革命都刷新了我们耳中所听到的声音的还原度和真实感。AVS3音频编解码是由数…
-
使用 Node JS 和 FFMPEG 编写视频编码器
最近需要了解视频编码器是如何工作的,所以首先想到了 FFMPEG。毫无疑问,这是最好的编写编码器,拥有众多功能。在本文中,我将向大家展示如何创建一个简单的视频编码器并分发编码后的视…
-
AVS感知无损压缩标准概述——视觉无损质量等级视频浅压缩
浅压缩又称夹层压缩,是一种视频压缩级别,可以有效降低视频带宽,并能保持视频整体质量,压缩比通常为2:1到8:1。根据这一压缩比,4K、8K节目都可以用10G接口进行传输,这极大降低…
-
NNCodec: 神经网络编码 ISO/IEC 标准的开源软件实现 | ICML Workshop
本文介绍了神经网络编码 (NNC) 标准 (ISO/IEC 15938-17) 的第一个开源和符合标准的实现 NNCodec,并描述了其软件架构和主要编码工具。编码引擎的核心是上下…
-
如何从H.265视频编码器升级到H.266?
现在H.265软件编码器的压缩性能已经基本卷不动了吧,是否也该考虑考虑从下一代的H.266编码上来拿到更高的压缩收益了呢? 那从已有的H.265视频编码器升级到H.266视频编码器…
-
基于可解释贡献的轻量级稀疏自动编码器 | ICML 2023
随着深度学习模型变得越来越庞大,开发性能退化最小的轻量级模型至关重要。在本文中,作者提出了一种SHAP-SAE(SHapley Additive exPlanations base…
-
Linux 6.6 支持 Cirrus Logic CS42L43 音频编解码器
除了上周为 Linux 6.6 合并的显著声音更改(包括 AMD VanGogh SOF 支持和 Valve “伽利略 “设备的启用),本周通过 MFD 拉…
-
谷歌发布libaom 3.7 AV1编码器,重点优化编解码器接口、压缩效率等
继英特尔 SVT-AV1 1.7 编码器和 libavif 1.0 AV1 图像文件格式发布之后,9月1日,谷歌工程师又发布了 libaom 3.7,作为 AV1 编码库的最新功能…
-
视频编码在AIoTel中面临的挑战以及应对的策略和技术
AIoTel是一个组合词,它由AI+IoT+Telephony拼接而成,表达由智能设备、物联网、多媒体通信等技术构建的新型多媒体交互体系,也称作物联多媒体。本文将着重讨论视频编码在…
-
视觉无损的深度学习前处理算法
本文针对传统视频编码器的前处理问题,提出一种有效的训练策略和轻量化前处理模型,经测试,在H.264、H.265、H.266上都能获得一定的增益效果。 论文标题:Rate-Perce…
-
英特尔 SVT-AV1 1.7 视频编码器提供更快的性能
近日,Intel 主导的 SVT-AV1 开源 AV1 视频编码器发布了一个主要版本,全面提升了性能。 SVT-AV1 1.7 是新版本,是基于 CPU 的 AV1 视频编码又向前…
-
AVS3变换:PBT、ST和SBT
前面的文章介绍了AVS3中的变换工具IST和ISTS,本文将介绍AVS3中剩余的几种变换工具:基于位置的变换(PBT,Position Based Transform)、二次变换(…
-
自主AVS3语音编码项目研究进展
实时语音通信技术(RTC: Real-time Communication),已广泛应用于协同办公、互动娱乐、社交等领域。上述多样丰富的应用场景给实时语音通信技术提出了多种技术挑战…
-
代码只有千行左右的JPEG编码器
时至今日,我想JPEG(1992)应该是有损压缩图片编码格式里最最简单的一个吧。 有多简单呢,如果用代码量来看的话,网上开源的TinyJPEG项目,即使算上代码注释,总共也只有12…
-
分析 SVT-AV1 预设值: 尺寸、质量和速度与 CRF 变化
在本文中,我们将通过改变 CRF 值来观察 SVT-AV1 预置的性能,并展示客观质量(PSNR、VMAF、SSIM)、文件大小和编码速度的变化情况。 由谷歌、微软、Mozilla…
-
“多”维演进:智能化编码架构的研究与实践
大家好,我是阿里云视频云的陈高星,今天和大家分享的主题是“多”维演进:智能化编码架构的研究与实践。 本次分享分为四部分:首先是视频编码与增强方向的业界趋势,其次是对在该背景下衍生的…
-
MPEG 最终确定 ISOBMFF 中未压缩视频和图像的传输
在第 143 届 MPEG 会议上,MPEG 系统(第 3 工作组)最终确定了 ISO/IEC 23001-17–以 ISO 基本媒体文件格式(ISOBMFF)传输未压…
-
AVS3:跨多通道预测PMC
前面的文章中介绍了TSCPM,它是AVS3中用于intra模式的跨通道预测技术,它利用线性模型根据亮度重建像素预测色度像素。 跨通道预测技术用于去除不同通道间的冗余信息,TSCPM…
-
VVC视频播放现状
本文分享者 Jan Ozer 在演讲中从三个不同的目标平台——电脑端、移动设备端以及起居室中的电视端讲述了VVC视频播放的现状。 来源:Streaming Media East 2…
-
用于VOD的VVC编码 | Streaming Meida East 2023
本演讲对 VVC 编解码的工作原理、目前的优化方向以及已有工作的发展情况进行了介绍。此外,还将 VVC 与其他编解码方式进行了细致的比较。 来源:Streaming Meida E…