技术文章
-
如何使用React和NestJS录制高质量的现场音频(高达48KHz,立体声)?
在许多 Web 应用中,我们可能需要为许多目的录制音频,如语音转文字、记录对话、实时音频/视频会议、语音消息、语言学习和发音练习,以及用户反馈和客户支持。 使用 MediaReco…
-
什么是往返时间以及它与网络延迟的关系?
往返时间是一个重要的指标,可以表明两个端点之间可用的通信质量。这是我们团队经常与客户讨论的一个指标,因为它直接关系到用户体验到的服务质量。往返时间可以受到一系列设计决策的影响,特别…
-
什么是通讯API?如何选择通讯API
在快速发展的商业环境中,有效的沟通是成功的核心所在。然而,传统的通讯方法不足以满足不断发展的企业需求。今天,企业需要不间断地访问视频会议、即时通讯功能、双向短信和其他通信功能。这就…
-
深度学习在声源定位中的应用
什么是声源定位(Sound Source Localization,SSL)技术?声源定位(SSL)是基于记录的多通道传声器信号来估计一个或多个声源相对于某个任意参考点的位置的问题…
-
Unity AI生成VR全景工具迎来重大更新,草图+文本控制模式上线
文本生成 360° 全景图的工具又发布了重磅更新。重磅更新是什么呢?原来我们只能通过文本控制生成,只能控制生成的内容,但没办法控制生成的结构。 比如我想在某个位置有扇门,某个位置有…
-
淘宝拍照基于端云协同的视频流实时搜索实践
本文介绍了实时视频流的主体识别场景,未来实时搜将会融合图搜主链路并在XR场景发力,未来的场景我们取名为“元视界”(MetaSight)。 作者:绍楠、素流来源:大淘宝技术 引言 很…
-
使用HLS(HTTP直播流媒体协议)进行视频传输时要避免的 7 个错误
在过去的几年里,流媒体视频已经成为一个主要的娱乐来源,它已经成为全世界互联网使用的主要消费者。随着全世界有这么多人收看他们喜爱的电影和电视节目,流媒体和内容提供商应该知道如何避免在…
-
Meeting Application Deadlines with DTP | ICNP 2022
许多应用程序对数据传递有截止时间要求,例如实时视频、多人游戏和云端增强现实/虚拟现实。然而,当前的传输层API过于原始,无法满足这些要求。因此,如今的应用程序被迫构建定制和复杂的截…
-
视频传输协议有哪些: RTMP、SRT、HLS、MPEG-DASH 和 CMAF的优缺点
从 RTMP 到 SRT、HLS、MPEG-DASH 和 CMAF,当前可用的视频传输协议列表非常广泛且令人困惑。作为我们的视频编码基础系列的一部分,我们试图揭开视频编码的一些基础…
-
视觉说明:通过实时视觉画面增强语言交流
在日常生活的对话中,人们会提及他人不熟悉的主题内容。在Zoom等在线会议中,即时的字幕可以帮助人们理解他人所说的话语。在这些场景下,该工作提出使用视觉图像进行辅助传达信息。具体来说…
-
linux下离线安装FFmpeg,配套组件 yasm
FFmpeg是处理音频、视频、字幕和相关元数据等多媒体内容的库和工具的集合。这里记录linux下离线安装的过程。 ffmpeg下载地址: http://www.ffmpeg.org…
-
WebRTC实战 | 视频云
WebRTC是当前实时通信领域的重要技术之一,具有广泛的应用前景。可以实现音频、视频和数据的实时传输。支持点对点通信、多方会议、屏幕共享等多种应用场景,同时具有高质量、低延迟、强安…
-
带你了解云游戏实现关键技术——WebRTC
云游戏作为一个极具潜力的新技术,正在游戏领域不断攻城略地。虽然云游戏的概念早在10~20年前就已经存在,但一直无法流行,其根本原因是技术上的制约。而现在,云游戏得以快速井喷发展,得…
-
音视频问题汇总–如何兼容实时音视频加密?
背景介绍: 最近收到一个网友问题,说他们设备不兼容客户的zrtp SHA 80的加密,他们搞了几天没有完成,问是否可以协助一下。 最初定位是因为不支持SHA80的,那做一下兼容就可…
-
基于机器学习的语音编解码器 Lyra
Lyra是一种基于机器学习的语音编解码器,通过引入预测方差正则化来降低对异常值的敏感性,从而提高性能。Lyra使用自回归模型WaveNet进行过程建模,并通过输入噪声抑制来显着提高…
-
ffmpeg硬件加速代码方式
本文中实例测试时机器使用的是AMD的CPU,显卡为Amd的集成显卡。 1、查询本机器支持的ffmpeg硬件加速框架命令: 返回的内容: 2、使用-hwaccel 分别加步…
-
音视频相关协议-hdcp
一、前言: 传输数字内容时,容易受到未经授权的复制和拦截。保护内容已经成为视听内容传输中的重要因素。2003年,英特尔开发了一种加密技术,称为高带宽数字内容保护(High-band…
-
量子互联网:从理论到实践 | 百度量子计算研究所
研究意义 量子互联网是通过量子技术赋能传统互联网的一种方式。通过对量子资源及量子特性的合理使用,量子互联网有望在数据传输效率、信息处理能力及网络服务安全等各方面为现有的互联网带来本…
-
浅谈基于NeRF的三维重建技术
当今,三维重建技术在计算机视觉和计算机图形学领域扮演着越来越重要的角色,它们有助于将物理世界中的实体转换为数字模型。三维重建技术的应用范围非常广泛,包括增强现实、虚拟现实、建筑设计…
-
以服务为中心的算力网络度量与建模研究
摘要:针对算力网络中的度量与建模问题,从算力网络度量体系的狭义和广义定义出发,阐述了当前算力网络度量与建模的研究进展,包括算力网络资源度量和算力网络需求度量两大部分。站在算力网络服…