技术文章
-
汽车之家IM即时通讯平台技术分享
1.前言 早期之家在C端产品的即时通信功能是直接使用第三方商业软件服务(SaaS),功能扩展性上存在很大制约,某些定制化业务需求很难实现,考虑到后续业务发展…
-
音视频生产关键指标:视频质量优化丨音视频工业实战
随着音视频内容日趋成为主要的内容消费载体,用户们对视频清晰度、画质的要求也在不断提高,我们在这里把视频清晰度、画质都统称为视频质量,来聊一聊如何对其进行优化。 1、视频质量评估标准…
-
音视频学习–iOS适配H265实战踩坑记
熟悉webrtc都知道:谷歌的webrtc,默认不支持h265,毕竟涉及到很多专利的事宜,这中间的八卦就暂时不做探究。但是今天拿到一个IPC,该设备会发送H265数据,如下图所示,…
-
企业im是什么意思,开发企业IM如何选择服务商
企业IM是什么 企业IM(Instant Messageing)是指企业的实时通信,是企业可以使用的实时交流和沟通工具。从广义上讲,企业IM是企业使用的沟通和内容管理的工具服务,企…
-
IBC365|2022年FIFA世界杯技术创新:超高清 HDR,混音,AI驱动的越位技术等
2022 年世界杯中人工智能驱动的分析将提供越位检查、表现数据统计和比赛用球中的传感器数据分析。本文对卡塔尔世界杯中的部分新技术进行简单介绍。 来源:IBC365作者:Adrian…
-
基于深度学习的低光照图像增强
之前在做光照对于高层视觉任务的影响的相关工作,看了不少基于深度学习的低光照增强(low-light enhancement)的文章[3,4,5,7,8,9,10],于是决定简单梳理…
-
流媒体开发浅谈:流媒体开发内容,现状,展望及相关技术栈
原标题:音视频杂谈–流媒体开发浅谈 最近收到好多个私信,包括后台和知乎:问一下寒冬之下,流媒体开发的一些基本东西,以及是否建议入坑。 要说明这个问题,其实挺多内容的,我…
-
如何确保跨浏览器和平台的视频 DRM 兼容性
视频 DRM 保护现在被认为是优质内容平台视频基础设施的重要组成部分。虽然 DRM 技术可以帮助创作者最大限度地提高视频收入,但它们也带来了确保在大多数设备和浏览器之间实现兼容性和…
-
WebRTC传输协议(webrtc协议详解)
webrtc使用的协议栈如下图:左侧为传统的浏览器HTTP相关协议, 右侧为webrtc所使用的协议栈。 最上面一层为API层 对于http来说 他的下层使用的TLS协议 如果是h…
-
低延迟流媒体协议SRT、WebRTC、LL-HLS、UDP、TCP、RTMP详解
低广播延迟已经成为任何关于建设源端站和CDN的招标和竞争中的必要特性。以前这种标准只适用于体育广播,但现在运营商要求每个领域的广播设备供应商提供低延迟,比如:广播新闻、音乐会、表演…
-
快手虚拟世界互动平台及解决方案
快手针对虚拟世界互动的技术方案主要分为两方面,分别是平台和软件。在平台侧快手构建了快手虚拟世界互动平台(KMIP),基于 PAAS 技术基础支撑各种上层应用。在软件侧,面向不同应用…
-
如何使用 FFmpeg 打造自己的播放器
前面 FFmpeg 系列的文章中,已经实现了 FFmpeg 的编译和集成,基于 FFmpeg 实现音视频的播放、录制,并结合 OpenGL 添加丰富的滤镜等功能,这些 d…
-
8K联盟 | 视频编码进展讨论
参与讨论的大多数专家都曾参与 HEVC, VVC, AV1 和 LCEVC 编码器的研究,但主要是在广播服务方面,而非 OTT 业务。 来源:8K Association | 20…
-
在视频中,使用YUV420好,还是YUV444好?
视频和图像的颜色空间类型有很多,比如 RGB、YUV、HSV、LAB 等,其中,YUV 颜色空间又有 YUV420、YUV422、YUV444 之分。先不考虑 YUV422 格式,…
-
音视频开发进阶课程|第七讲上:一文讲透音视频分辨率
在视频系列的前几篇推文中,我们已经接触了视频相关的不少概念,它们都是围绕着几个核心角色 :色彩、像素、图像和视频来展开的。这几个核心角色之间的关系,大家应该都有了基本的了解,我们再…
-
libWebRTC是什么?一文了解libWebRTC使用方式
要了解 libWebRTC 存在的原因及其如此重要的原因,我们应该从 2011 年谷歌首次宣布一个闪亮的网络浏览器新开源项目时的草根开始。 该项目已经转移到一个全新的网站webrt…
-
WebRTC IP 泄漏:您还应该担心吗?
了解 WebRTC IP 泄漏的历史:一个新的 JavaScript 库如何无意中引入隐私问题、它是如何被利用的,以及这个问题得到了多大程度的解决。 在进入本文的精彩部分之前,您需…
-
webrtc架构详解(webrtc架构图分析)
对于WebRTC的架构说明,官方的英文文档已经说的很清楚了,所以本文可能更多的是充当这一个翻译者的角色。下面我们从上往下分别了解WebRTC的架构设计。 三层架构 首先我们从Web…
-
PCS 2021 | 视频 VMAF 分数的可微分估计
当前的感知视觉质量评价指标(Perceptual Visual Quality Metrics,PVQMs)通常是复杂且不可微的,这使得它们很难在恢复和压缩调优中用作损失函数,传统…
-
语音模型可根据嘴唇动作识别不同语言
近年来,深度学习技术在许多语言和图像处理任务中取得了显著的成果。这包括视觉语音识别(VSR),它只需要通过分析说话人的嘴唇运动来识别说话的内容。 a-c、基线ASR模型(a)、基线…