技术文章
-
为什么显示图像要做Gamma矫正?
先简单说一下Gamma(伽玛)值是什么? Gamma值的广义定义就是输入值和输出值的Gamma幂指数关系,用来补偿人眼对自然亮度的非线性感知。输入与输出关系如下图所示: 输入和输出…
-
显示器中的HDR10、HDR400、HDR600有什么区别?
HDR10和HDR400、HDR500、HDR600、HDR1000等看似是类似的概念,都是HDR后面带了一个数字,但实际意义却相差甚远。 HDR10是一种使用最普遍、最广泛的HD…
-
AV1编解码的起源竟与RC模拟遥控飞机有关?
本文由微帧科技制作的专栏The VideoVerse采访撰写。The VideoVerse每期都会邀请一位技术专家探讨视频技术,内容涉及视频编解码、智能处理、视频采集与播放、视频传…
-
ECCV 2022 | DFRF:用于小样本谈话人脸合成的动态部人脸辐射场
这篇文章提出了一种用于小样本谈话人脸合成的动态人脸辐射场,使用音频信号耦合3D感知图像特征作为条件来快速泛化至新的身份。为了更好地建模嘴部动作,进一步学习了一个基于音频条件的人脸变…
-
音频评测之音质主观评测
专业音质听音评价第二期将为大家介绍听音评价过程中包含的重要环节。 一 主观音质评价 音质评价就是运用各种客观和主观的方法对声音的质量做一个科学、广泛、综合的定性和定量分析。 音质是…
-
音频评测-专业音质听音评价的基本概念
专业音质听音评价第二期将为大家介绍一些听音评价的基本概念。 声音的基本概念 Sound & Audio 一 声音的基本要素 声音三要素是响度、音高、音色。人耳对声音能量的感…
-
音频评测-专业音质听音评价的听觉生理和心理
听觉的产生- Acoustic 人的听觉过程是一个复杂的生理及心理过程。声波作用于听觉器官,引起听感细胞的兴奋并导致听神经的电脉冲发放传入信息,经各级听觉中枢分析后便产生听觉。 一…
-
虚拟现实VR视频技术介绍
本期文章为大家带来VR视频技术的相关知识。文章主要从VR视频压缩编码,视频传输,渲染显示等几个方向进行简单的介绍。 01 3DoF VR和6DoF VR VR视频是指全景视频,如水…
-
IM专题:分层架构IM系统(5)— Entry设计
在分层架构中,Entry 向客户端提供了 TCP 长连接的接入能力,并对这些长连接的活性进行保活维护(IM专题:分层架构IM系统(1)—架构解读),所以在 Entry 服务内部有两…
-
图像分割的方法(图像分割的技巧)
图像分割是图像处理和计算机视觉的热点之一,是根据图像内容对指定区域进行标记的计算机视觉任务。它基于某些标准将输入图像划分为多个相同的类别,简言之就是「这张图片里有什么,其在图片中的…
-
ManVatar:基于运动感知神经体素的三维头像快速重建
本文提出了一种基于运动感知神经体素的快速三维头像重建方法 ManVata。ManVata是第一个将表情动作与标准外观解耦的头部模型,并用神经体素对表情动作进行建模。在给定单目视频的…
-
什么是视频插帧?视频插帧怎样理解
本文为大家分享什么是视频插帧、视频插帧有何应用意义、动画插帧与自然视频插帧有何不同、帧率和刷新率是一回事吗,以及流插帧算法之光流法是什么等问题。 什么是视频插帧? 视频插帧,指通过…
-
QML与C++混合编程(C++与QML交互)
一、QML与C++混合编程简介 QML与C++混合编程就是使用QML高效便捷地构建UI,而C++则用来实现业务逻辑和复杂算法。 二、QML访问…
-
流媒体传输技术rtp
WebRTC作为一个实时音视频传输技术,实时性是RTC技术的主要评判标准。在整个实时音视频系统中,对实时性影响最大的就是传输层。当今通信技术众多,但是都离不开两个基础的协议,即TC…
-
Android Camera2中怎么获取预览YUV数据
Camera1中我们可以通过onPreviewFrame接口直接获取到默认为NV21格式的预览数据, 如下图注释所示,还可以通过调用setPreviewFormat方法要求Came…
-
Android Camera2详解(Android Camera2架构和使用流程)
Camera API2是Google从Android5.0开始推出的配合HAL3使用的一套新架构,相比于API1,对应用层开发者而言开放了更多的自主控制权,主要特性包括: 可以获取…
-
网络传输协议之QUIC(音视频基础知识篇)
据非官方说法,2015年被定义为中国互联网视频直播元年,笔者有幸在当年响应互联网大潮,试水了视频直播业务,但当时的关注点主要是如何让直播内容吸引眼球,获取更大的用户群来融资,内容为…
-
高清主流视频编解码参数分析
随着网络、终端设备的蓬勃发展,视频类业务呈两级分化态势发展,一方面是短视频的爆发,有效填充了用户的碎片时间,取得了非常客观的用户量及点击率;而另一方面则是沉浸式殿堂级别视频,诸如我…
-
一文讲透音视频编解码M3U8(M3U8格式结构和解析)
一、M3U8格式 HLS(HTTPLiveStreaming)是苹果公司针对iPhone、iPod、iTouch和iPad等移动设备而开发的基于HTTP协议的流媒体解决方案。在HL…
-
WebRTC NACK框架和算法(音视频中NACK优化)
在WebRTC中,前向纠错(FEC)和丢包重传(NACK)是抵抗网络错误的重要手段。FEC在发送端将数据包添加冗余纠错码,纠错码连同数据包一起发送到接收端;接收端根据纠错码对数据进…