技术文章

实时音视频

App内嵌视频通话屏幕共享功能实现

App内嵌视频通话屏幕共享是一项常见功能，所谓屏幕共享是指在视频通话或互动直播过程中将屏幕内容以视频的方式分享给其他的观众，以增强互动体验，提高沟通效率。本文以 iOS 平台为例，…

ZEGO即构科技
2025年12月8日
实时音视频

EchoFree—超轻量神经声学回声消除模型 | ASRU 2025

声学回声消除（Acoustic Echo Cancellation, AEC）作为语音通信系统的核心预处理模块，其核心任务是从麦克风采集信号中实时分离近端语音（near-end …

音频技术
2025年12月8日
技术文章

语音AI编排：大规模构建高质量语音AI代理的关键环节

语音 AI 已从实验演示阶段走向日常运营。如今，企业将诸多职责委托给自动化语音系统，包括预约安排、潜在客户资格审查、后续跟进、支持分流和招聘筛选。Omdia 的《2025 年对话式…

AIGC
2025年12月5日
实时音视频

语音通话与视频通话：为什么 VoIP 通话仍然占据一席之地

如今视频通信已成为现代协作的重要组成部分，人们自然会想知道，传统的纯语音 VoIP 系统在当今环境中是否还有有意义的地位。对于正在评估通信策略的企业而言，这个问题至关…

RTC观主
2025年12月4日
即时通讯

统一 MQTT 发布/订阅与消息队列：EMQX 6.0 背后的架构

MQTT 发布/订阅模式的局限性规则引擎是 EMQX 内置的基于 SQL 的数据处理组件，专为物联网场景设计，能够高效、低成本地实现实时数据流转与处理。如今，大多数物联网系统看起…

IM开发老王
2025年12月4日
实时音视频

人工智能驱动的视频编解码技术解析 | 灯塔智库

写在前面：视频数据作为视觉信息处理中最大的大数据类别，正以指数级速度增长，长期主导全球网络流量。新兴应用场景如超高清视频、交互式视频会议与远程屏幕共享，对视频编解码提出了更高要求。…

大厂Animal
2025年12月3日
实时音视频

【音视频】如何埋点统计播放器卡顿率和卡顿时长

在对播放器进行性能埋点时，如何准确统计出每次播放的总的播放时长以及卡顿时长，从而准确统计播放卡顿率？

RTC观主
2025年12月3日
技术文章

MPEG-H 和 Dolby Atmos 技术对比，广播公司更偏爱谁？

下一代音频 (NGA) 是一系列技术，它将音频从固定声道混音扩展到沉浸式、对象驱动和元数据驱动的体验，使其具有个性化、易用性和跨设备可扩展性。NGA 允许单个节目携带离散元素（声道…

音频技术
2025年12月3日
即时通讯

异步 Django：将 WebSocket 扩展至 100 万并发连接

本文讲述如何实现将 WebSockets 扩展至 100 万并发连接，踩了哪些坑，以及在扩展异步 Django 应用过程中汲取的经验教训。

IM开发老王
2025年12月1日
技术文章

AAAI 2026｜MARS：基于多模态检索和选择增强的对话LLM语音识别

随着以智能助手为代表的人机语音对话系统和会议转录与纪要等应用的爆发，对话语音识别（Conversational ASR）技术变得愈发重要。对话语音（Conversational …

AIGC
2025年12月1日
实时音视频

Android音视频性能优化技术

在资源有限的Android设备上进行音视频处理时，性能优化至关重要。AVSample项目展示了多项关键优化技术，可显著提升多媒体应用的性能。 1、原生库编译优化项目针对FFmpe…

RTC观主
2025年12月1日
技术文章

AI驱动的语音质量评分：衡量的不仅仅是MOS

在语音通信领域，通话质量不仅仅取决于技术规格，它直接反映了团队协作方式、客户服务体验以及企业日常运营。多年来，业界一直依赖平均意见得分 (MOS) 来衡量语音质量。尽管 MOS 确…

音频技术
2025年11月27日
实时音视频

揭秘并解决直播延迟问题(直播延迟怎么解决)

媒体和娱乐行业近期最引人注目的市场趋势之一是流媒体直播的增长。全球流媒体直播市场从 2022 年的 12.4 亿美元增至 2023 年的 14.9 亿美元，复合年增长率（CAGR）…

ZEGO即构科技
2025年11月27日
实时音视频

【音视频】原生媒体播放器实现

本文探讨 AVSample 项目中的原生媒体播放器实现，该实现展示了如何使用 Android 原生 API 构建高性能的音频和视频播放器。

RTC观主
2025年11月27日
实时音视频

播放器视频后处理实践（二）氛围模式

百度播放内核团队将氛围模式效果应用到了视频播放场景，用于提升用户观看视频沉浸感，同时在百度App、好看App两款产品完成上线。本文将详细说明视频场景氛围模式技术方案。

大厂Animal
2025年11月26日
实时音视频

【音视频】基于 Java 的媒体播放器

这个系列文章我们来介绍一位海外工程师如何探索安卓音视频基础技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，本篇介绍 Java 媒体播放器。 ——来自公众号“关键…

RTC观主
2025年11月26日
WebRTC

WebRTC在您离开时依然运行，Pion 中自动重选机制概述

视频通话的网络连接听起来很简单。你把视频发送到服务器，服务器再把视频发送回来。但这种思维模型在现实世界中会失效。一个最初在稳定的家庭Wi-Fi上建立的连接，可能会因为有人走出家门而…

webrtc学习和实践
2025年11月25日
即时通讯

即构科技 uni-app x 离线推送 SDK (ZPNs SDK v2.8.0 UTS 插件) 发布

2025年11月24日，即构科技 uni-app x 离线推送 SDK——ZPNs SDK v2.8.0 UTS 插件首次发布，支持接收 Apple、Google、华为、小米、OP…

ZEGO即构科技
2025年11月25日
即时通讯

利用 EMQX 消息队列解决关键物联网消息传递挑战

MQTT 的实时性优势在面对异步操作时显得捉襟见肘，这正是许多物联网项目变得复杂的根本原因。而基于 EMQX 消息队列功能，这种统一、高效的消息处理模式已成为现实。

IM开发老王
2025年11月25日
技术文章

什么是各向异性扩散？各向异性扩散优缺点

什么是各向异性扩散？各向异性扩散（Anisotropic Diffusion）是一种先进的图像处理技术，主要用于图像平滑和边缘保持。各向异性扩散（也称为Perona-Malik扩…

图像处理
2025年11月25日