技术文章
-
什么是视频分辨率?流媒体视频分辨率指南(一)
在当前的数字时代,视频内容已成为我们生活中不可或缺的一部分。视频分辨率在我们的观看体验中起着至关重要的作用。视频分辨率对内容的质量有很大影响。这是主播忽略的一个关键因素。屏幕上可见…
-
基于神经网络的空间音频渲染技术探析
1 前言 如何给用户带来更加真实的沉浸体验,是元宇宙音频技术研究的核心使命。空间音频(Spatial Audio)也称三维声,正是肩负着这样的使命应运而生,空间音频不仅能实现三维的…
-
AVS3中的ESAO
增强样点自适应补偿(Enhanced Sample Adaptive Offset)是AVS3中新增的环路滤波技术,和SAO相比其更充分的考虑了纹理和边缘方向特征。ESAO是在整帧…
-
ARC 和 eARC 能做什么?HDMI 音频功能指南
本文解释什么是 eARC(增强型音频回传通道)和 ARC(音频回传通道),它们有什么区别,以及 HDMI 功能适用于什么。 在家庭或客厅影院中,大多数情况下,HDMI 电缆用于将两…
-
音视频面试题目:播放器的设计及解决卡顿,花屏问题等
以下来自txp玩Linux公众号分享的内容。 今天给大家分享最近一个球友面试的音视频题目,同时我们星球上的球友也转行成功到音视频行业,在今年很多企业都缩减的情况下,着实不容易。 面…
-
FreeRTOS 怎么实现任务间通信
FreeRTOS 是一个可裁剪、可剥夺型的多任务内核,十分好用,而且没有任务数限制,在此之前分析过很多了,简单来说,FreeRTOS实时系统能够创建多个独立的任务,并且任务之间互不…
-
在线 KTV 实现过程(内附demo源码)
摘要:教你3步快速实现在线KTV的开发。 在线K歌自2014年兴起以来,已经发展出了无比庞大的用户群体,每两人中就有就有一人体验过在线 K歌,其前景不可小觑。 如此庞大的…
-
HDFS EC在B站的实践
1.背景 随着B站业务的高速发展,业务产生的数据每天以PB级的速度持续增长,之前主要应对方法是分析数据的使用频率,把数据分为热冷俩类数据,对冷数据进行高密存储来降低存储成本,以及对…
-
音视频编解码—JPEG3 Baseline流程介绍
上一篇讲解了jpeg的基本调用逻辑,但是有朋友私信说其中几个概念不太理解,所以本文做一下说明: base line JPEG JPEG 有许多指定版本,JPEG base line…
-
用多个声学全息图打印3D物体
在本文中,我们将探讨这种采用多个声学全息图的创新方法的工作原理,并研究其潜在的应用和局限性。 声学全息图是可以将声波塑造成复杂图案的设备。它们由具有特定图案的孔或凸起的3D打印板制…
-
DVB-I:试点如何为商业发射铺平道路
DVB-I 是一种通过一组流媒体协议发现服务的方式,使公司能够愉快地进行流媒体内容。它只受入户管道大小的限制,将广播的一对多与一对一统一起来。George Jarrett 报道了意…
-
音视频ADC在动态范围上的应用
ADC作为模拟与数字信号转换的渠道,是当下数字信号的主要来源之一。随着短视频平台、AR/VR的兴起,产出音视频图像内容已经与我们息息相关了,对音视频ADC的各项指标提出了新的要求,…
-
VLAN的基本配置
1. 原理概述 交换机的VLAN端口可以分为Access、Trunk和Hybrid3种类型。 Access端口是交换机上用来直接连接用户终端的端口,它只允许属于该端口的缺省VLAN…
-
视频压缩客观度量 BD-Rate 和 BD-PSNR的计算和解释
BD-Rate 和 BD-PSNR 是视频压缩中使用的客观度量,用于比较两种不同视频编解码器或同一视频编解码器在一定范围内的比特率或质量值的不同设置的率失真性能或压缩效率。本文着眼…
-
NeuMan:从单视角视频中创建数字人
本文提出了一个新颖的框架,可以从单一野外视频中重构人物和场景,并能够渲染出新的人体姿态和视角。给定一段由移动相机捕捉的视频,作者训练了两个 NeRF 模型:一个是人类的 NeRF …
-
从阵元域到模态域的三维音频技术
随着视频空间化的进程,人们对音频空间化也越来越感兴趣。空间音频也称三维音频,是一项可以在扬声器阵列或者耳机上产生三维方位感的音频技术,其目的是营造一种身临其境的体验,在这种体验中,…
-
什么是EVC(MPEG-5 Part-1)?EVC的标准、架构及编码工具
MPEG-5 Part-1 或 EVC 或基本视频编码是三星、华为、高通和 Divideon 支持的 MPEG 标准。它由两个配置文件组成 – 一个仅使用过期专利且免版…
-
清华朱军团队开源首个基于Transformer的多模态扩散大模型,文图互生、改写全拿下
该论文提出了一个为多模态设计的概率建模框架 UniDiffuser,除了单向的文生图,还能实现图生文、图文联合生成、无条件图文生成、图文改写等多种功能。 据悉 GPT-4 将于本周…
-
ICASSP2023 通用会议理解及生成挑战(MUG)成功举办及获奖团队结果分析
近日,ICASSP2023 通用会议理解及生成挑战(MUG)完成了测试集评测及结果公布,并举办了线上完赛沙龙。本次挑战由ModelScope魔搭社区、阿里巴巴达摩院语音实验室、阿里…
-
视频编码中的Closed GOP 和 Open GOP
在本文中,我们将了解Closed GOP 和 Open GOP 的概念。这两种 GOP 类型在视频流中都很常见,并且会影响您的压缩效率、流的错误恢复能力以及 ABR 流中的可切换性…