技术文章
-
MediaCodec 音频处理
在 Android 多媒体开发领域,音频处理是许多应用的基础需求,从录音应用到视频流媒体平台皆是如此。AVSample 仓库通过 Android 的 MediaCodec API …
-
VisionWeaver:从“现象识别”到“病因诊断”,开启AI视觉幻觉研究新篇章
长久以来,我们只知道大型视觉语言模型(LVLM)会犯错,但始终缺乏一把“手术刀”,无法剖析其视觉感知的根源性缺陷。我们只知其然,不知其所以然。我们希望当 AI 模型观察图像时,不再…
-
携程数字人直播实战:成本降低90%,我们如何实现规模化落地?
本文将主要携程团队设计开发携程数字人直播产品的背景、方案调研、设计和研发过程中遇到的问题以及解决方案,同时也介绍了本产品的主要功能和未来的规划。
-
React Native如何接入直播功能(基于ZEGO React Native直播SDK开发)
使用 React Native 构建直播应用是为用户提供交互式实时体验的绝佳方式。React Native 的跨平台特性与丰富的库生态系统,使其成为开发流媒体应用的理想选择。无论您…
-
如何高效地在云端举办直播活动
众所周知,当今观众渴望随时随地通过互联网在任何设备上自由观看内容。同样公认的是,云技术为广播公司提供了亟需的灵活性和可扩展性,使其更易满足这些需求。然而云技术同样依赖 IP 网络,…
-
抛开炒作,看清5G:掌控体育赛事直播制作
5G 一直被宣传为将彻底改变直播行业的技术。其潜力显而易见,确实堪称直播制作中缺失的关键环节,但也面临着巨大的技术和商业挑战
-
关于未来语音技术和应用趋势的10点看法
在这个技术变革的时代,本文分享10点个人对于智能语音技术和应用在未来几年发展的看法。
-
视频流媒体效率 5 大支柱:如何更快上线、更智能扩展、更明智支出
对于当今的流媒体服务而言,运营效率已成为关键差异化因素,其核心不在于比特率或压缩技术,而在于平台架构设计、部署实施与扩展能力。随着云基础设施和 AI 增强流程的普及,竞争焦点正从功…
-
Meta AI 发布 Omnilingual ASR:一套支持1600 多种语言的开源语音识别模型
如何构建一个能够理解数千种语言(包括许多以前从未有过有效自动语音识别 (ASR )模型的语言)的语音识别系统? Meta AI 发布了 Omnilingual ASR,这…
-
AV1解码生态全景图
本文是截至2025年11月最完整详尽的 AV1 解码生态全景报告。AV1 编码标准凭借高效、免费、开放的核心优势,已在北美流媒体市场完成从技术迭代到生态落地的全面突破。
-
如何确保高清视频通话帧率稳定并消除视频抖动
本文将探讨帧率稳定性的重要性,并解释帧率波动的原因。此外,本文还将介绍一些基于 ZEGO 的实用策略,以确保视频应用中的帧率稳定性并减少抖动。
-
D-FCGS: 面向自由视角视频的动态高斯泼溅前馈式压缩 | AAAI 2026
本文提出了 D-FCGS,一种基于前馈压缩框架的动态高斯泼溅压缩方法,专为自由视角视频(FVV)设计。该方法通过标准化帧组(GoF)结构、双先验感知熵模型和控制点引导的运动补偿机制…
-
如何通过 ZEGO SDK 在视频通话中实现音频静音
视频通话已成为我们沟通的主要方式之一。背景噪音或其他干扰有时会让人难以集中注意力或进行清晰的对话。此时,音频静音功能便显得尤为实用。它允许用户暂时关闭麦克风,从而减少背景噪音,提升…
-
ZEGO即时通讯SDK发布2.24.0版本,新增查询合并消息支持携带messageID等功能
2025 年11 月 6 日,ZEGO即时通讯SDK(ZIM)2.24.0 版本发布,新增查询合并消息支持携带 messageID、离线推送功能支持附带 OPPO 私信模版等功能。…
-
FFmpeg 的 TLS/DTLS 安全层是这么实现的
本文将深入剖析 FFmpeg 中 TLS/DTLS 安全层的实现细节,从架构设计到具体实现,从证书管理到错误处理,带您全面了解这一重要模块。
-
从远程观看到实时交互:WebRTC双通道在云测试中的实践与创新
本文将揭秘马上消费如何基于WebRTC,在云测平台实现双向技术突破:不仅完成了手机到浏览器200ms超低延迟投屏,更创新实现了浏览器到手机的活体认证视频流逆向传输。
-
ZLMediaKit Pro 专业版推出,专业级流媒体服务器解决方案
重磅推荐:基于广受好评的ZLMediaKit开源版本,全新推出专业版! ZLMediaKit Pro在保留开源版强大功能的基础上,新增了多项企业级功能,为您的流…
-
Juturna:简化实时媒体处理的 Python 库
Juturna 是一款采用 Python 编写的轻量级实时数据处理库,它的设计目的是让构建音频/视频/传感器处理工作流程变得简单。
-
云端协同构建 VR 院线,加速 LBE 产业化与规模化发展
本文基于云 VR 串流技术与 VR 一体机的协同发展这一逻辑,从产业现状、破局思路、实施路径三个维度展开分析,探索 VR 院线如何加速 LBE 产业化与规模化发展。
-
Meta:大规模视频隐形水印技术
本文将分享 Meta 如何克服隐形水印技术扩展过程中的挑战,包括如何构建基于CPU的解决方案,该方案不仅能提供与 GPU 相当的性能,更具备更优的运行效率。