技术文章
-
基于特征对齐和高斯表征的视觉有向目标检测 | 杨学,严骏驰
研究意义目标检测作为计算机视觉的基本任务之一,是实例分割、目标跟踪、行人再识别等视觉任务的基础,近二十年得到了广泛的研究和快速的发展。然而通用目标检测常常以水平边界框作为主要的目标…
-
6种必知的直播流媒体协议:HLS,RTMP,SRT,MSS,MPEG-DASH和WebRTC
直播流媒体是一个持续增长的现象。事实上,在这项研究中,有80%的人表示,他们宁愿观看直播,也不愿阅读一篇博客文章。此外,与标准视频相比,通过直播流播放的视频收到的观看时间多了27%…
-
实战开发一个GPT虚拟直播的Demo并推流到抖音平台
本文结合元宇宙和ChatGPT的优势,实战开发一个GPT虚拟直播的Demo并推流到抖音平台。 ChatGPT和元宇宙都是当前数字化领域中非常热门的技术和应用。结合两者的优势和特点,…
-
什么是WebRTC P2P mesh 以及为什么它不能扩展?
每隔一段时间就会有人提出用 WebRTC 广播或进行大规模视频会话的想法,而不使用媒体服务器。只是使用纯 WebRTC 的 P2P 网状技术。 虽然作为大学的研究课题很有趣,但我不…
-
从视频中获取帧图片的方法
数据在网络上是以很小的称为帧(Frame)的单位传输的,帧由几部分组成,不同的部分执行不同的功能。帧通过特定的称为网络驱动程序的软件进行成型,然后通过网卡发送到网线上,通过网线到达…
-
音频格式PCM介绍
PCM指的是脉冲编码调制(Pulse Code Modulation),是一种数字信号处理技术,将由波形表示的模拟音频信号转换为由1和0表示的数字音频信号。这个过程涉及对模拟信号进…
-
不同WebRTC应用中的信令回顾
这篇文章对各种流行的WebRTC平台中的信令通道实现进行了快速回顾。它考察了信道使用的协议,消息如何被序列化,以及应用程序是否使用会话描述协议(SDP)作为网络上的不透明字符串,或…
-
uniapp音视频通话质量监测实现(uniapp音视频开发系列6)
本文分享即构 uniapp实现音视频SDK 实现通话质量的功能。在通话或直播的过程中,用户可通过注册相关的回调以获得通话相关的信息,包括推流和拉流的质量报告、接收到音视频首帧的回调…
-
专家说:矿山数智化提速正当时,如何进一步提升语音通信能力?
5G技术的迅速发展,为矿山行业注入了强大的智慧力量。语音通信是矿山领域中一个重要的应用场景。本期移动Labs邀请了中国移动研究院-网络与IT技术研究所高级研究员王磊,与大家分享矿山…
-
Webrtc中如何展示窗口内容,同时不包含window title
Webrtc内置2种视频源捕捉器,屏幕的窗体的。它的窗体模式是带着微软视窗系统所有的window标准的标题栏的,也就是windows title。 那么怎么获取纯净的窗口内容,不要…
-
什么是WHEP?WebRTC流媒体介绍第2部分
在文章 什么是WHIP?中,我们讨论了 WebRTC 和为帮助我们使用它摄取数据而开发的新标准,称为 WHIP。但是,对于摄取的数据,可能需要在某个时候传出或分发相同的数…
-
什么是WHIP?WebRTC流媒体介绍第1部分
当考虑为你的实时流媒体平台使用哪种工具时,WebRTC是被带到前台的热门概念之一。虽然WebRTC自2011年以来一直存在,并在许多场景中得到成功应用,但将WebRTC优化为实时生…
-
Webrtc中如何确定通常意义上说的M108,M90是指什么
Webrtc中如何确定通常意义上说的M108,M90是指什么
-
Debian11系统下编译WebRTC M108 带H264硬件编码支持
执行命令. 首先vim ~/.bashrc中增加PATH内容。将Depot_tools目录增加进去。(当然还有Ninja目录)→因为GN命令就在这里 . 其次,设置set DEPO…
-
webrtc中如何使用自定义视频源
在WebRTC中默认提供2种视频源捕获器。分别是DesktopCapturer和 VCMCapturer, 即桌面捕获器和摄像头捕获器。 DesktopCapturer 目前可以多…
-
扩散视频自编码器:通过解纠缠视频编码实现具有时序一致的人脸视频编辑 | CVPR 2023
受人脸图像编辑方法的启发,相关研究将这些方法扩展到人脸视频编辑任务,所面临的主要挑战之一是编辑帧之间的时间一致性。为此,本文提出了一种基于扩散自编码器的新型人脸视频编辑框架,该框架…
-
音频“扩容”?4K超高清电视转播环绕声信号如何制作
2021年12月,央视杯2021中国男子手球超级联赛决赛阶段的比赛,在安徽合肥体育中心体育馆举行。安徽有“手球之乡”的美誉,当地许多中小学也成立了手球队伍。手超联赛首次落户合肥,正…
-
DMTet:一个用于高分辨率三维形状合成的混合表示方法 | NeurIPS 2021
摘要:我们引入了DMTet,一个深度的三维条件生成模型,可以使用简单的用户指导(如粗糙体素)合成高分辨率的三维形状。它通过利用一种新颖的混合三维表示方法,融合了隐式和显式三维表示的…
-
哔哩哔哩视频云画质与窄带高清AI落地实践
视频赛道卷到下半场,一定会面临体验与成本的对抗,尤其是在行业大环境“过冬”的背景下,想要在有限带宽下获得最佳的画质观感变得异常具备挑战性。从视频云业务场景的视角来看,如何有效解决c…
-
多链路传输技术在火山引擎 RTC 的探索和实践
传统的数据传输方式大多是利用一个链路、选择设备的默认网卡进行传输,使用这种方式实现实时音视频通话时,如果默认网络出现问题(如断网、弱网等),用户的通信就会发生中断或者卡顿,影响用户…