技术文章
-
将体视频表示为动态 MLP maps | CVPR 2023
体视频以3D形式捕捉动态场景,用户可以从任意角度观看,并获得丰富的体验。它是下一代媒体的基石,具有许多重要应用。与2D视频一样,体积视频应该能够进行高质量的实时渲染,并进行压缩以实…
-
低延迟流媒体协议 LL-HLS、LL-DASH、LL-CMAF和WebRTC 的优势及功能
在直播领域,延迟(直播事件发生到在屏幕上观看之间的时间延迟)是影响观众体验的重要因素。较低的延迟通常会带来更好的用户体验,特别是对于体育直播、在线游戏或互动直播活动等互动内容。本文…
-
什么是NAT?NAT的工作原理和各种类型
在广阔的网络领域,网络地址转换(NAT)在实现跨网络无缝数据流方面发挥着至关重要的作用。它是一个基本概念,允许专用网络中的多个设备共享一个公共IP地址。NAT已成为现代网络的重要组…
-
HLS协议是什么意思?HLS协议深度分析
HLS是什么意思? HLS(HTTP Live Streaming)是一种直播流协议,它利用当前广泛使用的 HTTP 技术为广大观众提供实时视频+音频体验。 它最初由 Apple …
-
如何在Expo React Native应用程序上部署WebRTC
如果你是一个React Native开发者,你很可能听说过Expo。事实上,我敢说你肯定听说过Expo。Expo CLI极大地简化了原生应用的构建、测试和发布,Expo CLI已经…
-
视频编码与视频转码有什么区别?
在当今的数字时代,视频已成为我们在线参与的一个重要方面,占据了社交媒体和流媒体平台。然而,视频的创建和分发需要技术程序,特别是视频编码和转码。 尽管视频编码和转码看似相似,但它们在…
-
ACL 2023 | 持续进化中的语言基础模型
尽管如今的 AI 模型已经具备了理解自然语言的能力,但科研人员并没有停止对模型的不断改善和理论探索。自然语言处理(NLP)领域的技术始终在快速变化和发展当中,酝酿着新的潮流和突破。…
-
百度iOS端长连接组件建设及应用实践
在过去的十年里,移动端技术飞速发展,移动应用逐渐成为主要的便捷访问和使用互联网的方式,承接了越来越多的业务和功能,这也意味着对移动端和服务器之间的通信效率和稳定性提出了更高的要求。…
-
使用基于 CNN 的定位器进行对象定位
对象定位是指精确识别和定位图像中感兴趣的对象的任务。它在计算机视觉应用中发挥着至关重要的作用,可实现对象检测、跟踪和分割等任务。在基于 CNN 的定位器中,对象定位涉及训练卷积神经…
-
虚拟语聊房Demo及示例源码运行指引
虚拟语聊房是元宇宙场景里一种新颖的语聊玩法,通过虚拟形象代替真人出镜,进行互动连麦语聊。在延续真人神秘感的同时,增加麦上用户之间的互动性,支持表情随动、声音驱动等多种 AI 驱动模…
-
视频会议应用中的人工智能集成架构
随着机器学习(ML)技术的最新改进,特别是生成算法和大型语言模型的改进,越来越多的会议应用正在将这些功能添加到其产品中。 这种ML技术可在两个不同层面应用于会议应用:基础设施层面,…
-
学习 WebRTC 的正确姿势?“碰碰运气”的方法不适用于 WebRTC 应用
WebRTC 如今可能无处不在,但使用它进行构建仍然很难。许多人试图依赖 Stack Overflow 中的代码片段,而不了解 WebRTC 的基本理论和流程。这可能是一种冒险的尝…
-
基于 QUIC 的 HTTP 自适应流媒体的可扩展高效视频编码 | EPIQ 2020
HTTP/2已经被广泛研究用于自适应视频流传输,但仍然存在由于TCP引起的先行阻塞和三次握手延迟的问题。与此同时,运行在UDP之上的QUIC可以解决这些问题。此外,尽管已经提出了许…
-
分布式UUID的生成策略及应用场景浅析
UUID是国际标准化组织(ISO)提出的一个概念。UUID用来识别属性类型,在所有空间和时间上被视为唯一的标识。本文将从UUID的构成方式、现行版本、生成策略、应用案例等方面作介绍…
-
FFmpeg 中 Libavutil 和 libavcodec库的方法和功能
ffmpeg还提供一系列的库,能提供开发者进行编码开发。其中 libavutil 是一个包含用于简化变成的函数的库,包括随机数生成器、数据结构、数学例程、核心多媒体实用程序等等。l…
-
基于真实环境的元宇宙场景搭建关键技术发展态势研究
摘要:基于真实物理环境构建的元宇宙场景是连接物理世界与数字世界的重要桥梁,也是实现数字孪生到虚实共生的重要途径。围绕三维重建、渲染等元宇宙场景搭建关键环节,总结了当前主流技术路径与…
-
WebRTC联播:谁决定在接收端选择哪一层?
在 WebRTC 中,接收端选择哪一层的决定通常由 WebRTC 实现和底层媒体堆栈来处理。适当层的选择取决于各种因素,例如网络条件、可用带宽和接收器的能力。 层的选择通常使用反馈…
-
利用WebRTC实现无缝实时通信
朋友们好,今天我们来谈谈WebRTC。首先,我将简要解释一下什么是WebRTC,然后我们将看看WebRTC的应用领域,以及我们为什么要选择WebRTC。 什么是WebRTC? We…
-
视频编解码器与视频容器的区别和用例
视频编解码器和视频容器在多媒体和流媒体中发挥着至关重要的作用。了解这些术语的区别有助于您在处理和分发视频内容时做出明智的决策。 本文将深入介绍视频编解码器和容器的基础知识,探讨它们…
-
深度学习在语音增强中的应用
随着科学技术的发展,语音作为新一代人机交互方式,成为人和智能设备、语音助手交流的重要接口,然而在真实环境中,语音信号不可避免的被各种噪声所干扰,除了各种环境噪声,声波在封闭空间中的…