技术文章
-
动态 HDR 与视觉区分的未来
媒体公司正在投资高动态范围(HDR)技术,以提升消费者的观看体验,但许多业内人士开始质疑目前的实施是否真正发挥了该格式的潜力。可预测的制作工作流程往往依赖于压缩 HDR 信号的静态…
-
哔哩哔哩Android视频编辑页的架构升级
本文介绍了哔哩哔哩Android视频编辑页的架构升级。以轻量化的视频编辑为核心思路,从界面布局、用户交互、已有功能优化、新增必要功能等方面对编辑页进行改版。
-
用于在企业边缘实现敏捷 WAN 部署的容器化网络功能 (CNF)
随着企业加速数字化转型并在分布式环境中扩展运营,对敏捷、可扩展且经济高效的广域网 (WAN) 解决方案的需求日益增长。传统的以硬件为中心的网络功能正在被更灵活、软件定义的架构所取代…
-
2025嵌入式音视频入门技术栈
2025嵌入式音视频入门技术栈,汇总了视频和流媒体、音频方向的技术栈。
-
WebRTC SIP 集成:实时网络和电话通信的高级技术
将 WebRTC 和 SIP 结合在一起是连接现代 Web 应用和传统电话系统的一种有效方法。无论是在浏览器中启用语音和视频,还是将应用程序连接到 PBX 和 SIP 中继,Web…
-
微帧GPU视频硬编优化引擎:面向人工智能大时代的AI算法与硬编协同优化方案
GPU硬件视频编码是利用GPU的专用硬件单元,实现高效、低延迟的视频压缩与编码的技术,其核心优势在于通过并行计算能力显著提升编码速度,同时降低功耗。
-
每个 VoIP 专业人士都应该了解的 BGP
当您拨打 VoIP 电话或加入 UC(统一通信) 会议时,只需点击“呼叫”或“加入”按钮,一切就绪!您可以与远程员工、合作伙伴和客户无缝沟通。这看似不可思议,但在幕后,一项至关重要…
-
WebRTC 的 NetEQ 抖动缓冲如何提供流畅音频
这个系列文章我们来介绍一位海外工程师如何探索 WebRTC 音视频技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍测量 WebRTC 的 NetEQ 抖…
-
NVIDIA AI 开发团队发布 Llama Nemotron Super v1.5:为推理和代理 AI 树立新标准
人工智能领域持续快速发展,不断突破模型在推理、效率和应用多功能性方面的极限。NVIDIA 的最新版本 Llama Nemotron Super v1.5 在性能和可用性方面实现了显…
-
网易图形面试:Vulkan 和 OpenGL 渲染管线的区别
Vulkan 和 OpenGL 渲染管线的区别。一句话:OpenGL 是动态管线,Vulkan 是静态管线。
-
适配鸿蒙操作系统!腾讯游戏直播SDK基于Kuikly三端一码开发实践
随着鸿蒙Next的发布,越来越多的APP开始推进鸿蒙化适配,产品与技术团队也启动了游戏电竞直播SDK的鸿蒙适配规划。投入足够资源通常能达成适配目标,但仅实现技术目标的意义相对单薄 …
-
Python 中的 RTSP 流媒体入门:构建实时视频流的初学者指南
什么是 RTSP? 想象一下,您正在观看手机上的实时监控摄像头画面。视频是通过互联网实时传输给您的。在幕后,一种特殊的 “语言 ”帮助您的设备请求视频、播放、暂停,甚至是回放(如果…
-
Rheomesh:开源 WebRTC SFU 服务器 SDK
Rheomesh 是一个由 Rust 编写的 WebRTC SFU(选择性转发单元)库。它提供了一个 SDK 来帮助您构建 WebRTC SFU 服务器。此外,它还提供了使用 Ty…
-
Meta 如何在云端转码视频
说到像 Meta 这样的视频转码业务,考虑到规模以及不同目标和场景的复杂阵列,Meta 如何进行云转码并没有简单的答案。但 Meta 技术项目经理 Hassene Tmar 在最新…
-
VLM2Vec-V2:用于跨图像、视频和视觉文档进行多模态嵌入学习的统一计算机视觉框架
嵌入模型通过将多样化的多模态信息编码到共享的稠密表示空间中,充当不同数据模态之间的桥梁。近年来,在大型基础模型的推动下,嵌入模型取得了长足进步。然而,现有的多模态嵌入模型大多基于 …
-
【音视频】计算真实的端到端往返时间(RTT)
这个系列文章我们来介绍一位海外工程师如何探索 WebRTC 音视频技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍计算真实的端到端往返时间 (RTT)。…
-
如何使用 WebRTC 和 Spring Boot 构建实时音视频通话
了解如何使用 WebRTC、信令和 STUN/TURN 服务器在 Spring Boot 应用程序中启用点对点实时通信。 为什么选择 WebRTC + Spring Boot? W…
-
SRT 和 SST 视频传输协议有什么区别?
SRT 和 SST 协议之间有什么区别?SST 和 SRT 都是实时视频传输协议,旨在通过非托管网络传输高质量、低延迟的视频。两者之间的根本区别在于,SRT 最初是为包括互联网在内…
-
实时视频处理与 WebCodecs 和流:处理管道
探讨 WebCodecs 和流在实时视频处理中未来的两篇文章系列的第一篇。本文第一部分回顾了使用现有和最新的网络 API 构建多步骤视频处理管道的步骤和可能遇到的坑。
-
DualDub:同时生成和谐的语音与背景音频,构建完整的视频音轨 | ACM MM 2025
当前视频到音频(Video-to-Audio, V2A)模型可以从视觉输入中生成逼真的背景音频,但它们大多忽略了语音在视频音轨中的关键组成部分。近期,西工大音频语音与语言处理研究组…