技术文章

技术文章

体积视频如何将3D渲染视频变为现实

诺基亚技术公司体积视频编码首席工程师兼技术负责人劳里·伊洛拉解释了体积视频如何推动增强现实和扩展现实领域的新应用。

虚拟现实
2025年11月4日
WebRTC

如何为 WebRTC 设置安全的 TURN 服务器（Coturn）

本文讲介绍如何自行部署 TURN 服务器，以实现安全、私密且具备生产环境就绪性的解决方案。

webrtc学习和实践
2025年11月3日
技术文章

大语言模型能够理解空间音频吗？

清华大学、剑桥大学与字节跳动的研究团队提出了一种让大语言模型（LLM）理解空间音频的新方法。与当前多模态大模型只能解析普通音频不同，这项工作让 LLM 有初步“听懂”三维空间中声音方向与定位的能力。

音频技术
2025年11月3日
即时通讯

95% 的互联网用户已使用即时通讯应用：这是最普遍的数字化习惯

数字世界中有一位无可争议的王者：移动即时通讯。根据 Statista 的数据，全球超过 94.5% 的互联网用户每月都会使用聊天应用程序。这一数字使即时通讯成为最普及的数字活动，其…

ZEGO即构科技
2025年11月3日
实时音视频

LongCat-Flash-Omni 正式发布并开源：开启全模态实时交互时代

自9月1日，美团正式发布 LongCat-Flash 系列模型，现已开源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 两大版本，获得了开…

大厂Animal
2025年11月3日
技术文章

AV1 运动矢量保真度实现高效的光流估计，作为高质量替代方案

运动估计是计算机视觉任务中至关重要却计算密集的环节，研究人员一直在寻求提高其效率的方法。来自都柏林圣三一学院的 Julien Zouein、Vibhoothi Vibhoothi…

编解码
2025年10月31日
实时音视频

流媒体服务商为何应采用统一可观测性策略以避免代价高昂的网站故障

在超级碗、格莱美颁奖礼和奥运会等重大直播活动中，观众期待的是清晰流畅、实时无中断的观赛体验。数百万观众同时收看，广告商更是不惜重金将产品展示在观众眼前。幕后，这给流媒体服务商带来了…

直播技术
2025年10月30日
实时音视频

什么是毫秒级延迟直播？毫秒级延迟直播方案有哪些

在流媒体领域，”延迟 “是指视频或音频数据从源传输到观众设备的延迟时间。试想一下，在观看足球比赛等直播活动时，在您的流媒体上看到进球发生之前，您的邻居就已经…

ZEGO即构科技
2025年10月30日
实时音视频

音视频网络传输优化

这个系列文章我们来介绍音视频相关面试题，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，本篇介绍网络传输优化。 ——来自公众号“关键帧Keyframe”的分享 1、优…

RTC观主
2025年10月30日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第十章模型上下文协议

本文是对《智能体设计模式》第十章的翻译。此章节介绍了模型上下文协议（MCP协议）。

AIGC
2025年10月29日
技术文章

触手可及：触觉技术成为虚拟现场体验的核心

整个视频行业，尤其是体育行业，正在走向多模态化。随着行业将分辨率、动态范围和音频保真度提升至难以进一步变现的高度，单纯的画面和音频已无法满足需求。因此，业界正将目光投向能增强赛…

虚拟现实
2025年10月29日
实时音视频

如何构建视频面试平台？

您是否了解一款能让招聘变得智能高效、不受地域限制的视频面试平台？该系统能更便捷快速地开展常规面试，助您发掘最优秀的候选人。若您想了解如何构建视频面试平台，本文将介绍其核心功能、使用…

ZEGO即构科技
2025年10月28日
即时通讯

常用 Web 实时通信技术：原理+选型，一篇通关

在 Web 开发中，实时通信技术的核心目标是实现客户端（Browser）与服务器之间低延迟、双向 / 单向的动态数据交互，而非传统 HTTP 的 “请求 – 响应” 模…

大厂Animal
2025年10月28日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第九章学习与适应

本文是对《智能体设计模式》第九章的翻译。此章节介绍了支撑智能体学习与适应的原理和机制。

AIGC
2025年10月28日
技术文章

非极客实时 AI 视频增强指南

本文分享 Pixop 的技术专家 Jon Frydensbjerg 眼中的 AI 视频增强。全文如下。致真正的非技术人士：本文同样面向非技术读者，据说并非所有人都知道“精灵（Sp…

视频技术
2025年10月27日
技术文章

观点：IPMX 是否正在取代 ST 2110？

IPMX（IP Media Experience）会取代 SMTE ST 2110 吗？不会，至少目前来说，它们针对的是不同的应用领域。IPMX是“简化版ST 2110（且可能更…

视频技术
2025年10月27日
实时音视频

音视频面试题集锦第 42 期｜ Android 音视频方向面试题实录

本文来自音视频技术社群关键帧的音视频开发圈的分享，该社群会定期整理一些音视频相关的面试题，本期分享 Android 音视频方向面试题实录。下面是我们技术社群的一位群友最近面试 J…

RTC观主
2025年10月27日
技术文章

《Agentic Design Patterns：构建智能系统的实战指南》- 第八章内存管理

本文是对《智能体设计模式》第八章的翻译。此章节介绍了智能体系统的内存管理机制。

AIGC
2025年10月27日
技术文章

Liquid AI 发布 LFM2-VL-3B，为边缘设备带来 3B 参数的视觉语言模型

Liquid AI 发布了 LFM2-VL-3B，这是一个用于图像文本到文本任务的 3B 参数视觉语言模型。它扩展了 LFM2-VL 系列，使其超越了 450M 和 1.6B 版本…

AIGC
2025年10月27日
实时音视频

基于 SRT 协议的安全推流整合方案在云手机产品中的应用

为落实国家“十四五”数字经济与新型基础设施建设规划，遵循数据安全法和个人信息保护法的相关要求，推动云手机安全传输技术国产化与标准化，针对云手机音视频流传输的高丢包、低安全与延迟等问…

mazhu
2025年10月24日