技术文章
-
StreamingMedia最新访谈:视频编转码现状及未来
特约编辑Jan Ozer 近期与Rethink Technology Research高级分析师Alex Davies进行了交流,讨论Rethink的新报告《2020年至2030年…
-
面向自然交互式对话人工智能的音频实时通信技术进展
本文介绍 Meta 如何开发一套强大的多层音频人工智能技术栈,实现与人工智能语音助手更加自然直观的交互。
-
【音视频】HLS 流媒体配置
这个系列文章我们来介绍一位海外工程师如何探索安卓音视频基础技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍 HLS 流媒体配置。 ——来自公众号“关键帧…
-
App内嵌视频通话屏幕共享功能实现
App内嵌视频通话屏幕共享是一项常见功能,所谓屏幕共享是指在视频通话或互动直播过程中将屏幕内容以视频的方式分享给其他的观众,以增强互动体验,提高沟通效率。本文以 iOS 平台为例,…
-
EchoFree—超轻量神经声学回声消除模型 | ASRU 2025
声学回声消除(Acoustic Echo Cancellation, AEC) 作为语音通信系统的核心预处理模块,其核心任务是从麦克风采集信号中实时分离近端语音(near-end …
-
语音AI编排:大规模构建高质量语音AI代理的关键环节
语音 AI 已从实验演示阶段走向日常运营。如今,企业将诸多职责委托给自动化语音系统,包括预约安排、潜在客户资格审查、后续跟进、支持分流和招聘筛选。Omdia 的《2025 年对话式…
-
语音通话与视频通话:为什么 VoIP 通话仍然占据一席之地
如今视频通信已成为现代协作的重要组成部分,人们自然会想知道,传统的纯语音 VoIP 系统在当今环境中是否还有有意义的地位。 对于正在评估通信策略的企业而言,这个问题至关…
-
统一 MQTT 发布/订阅与消息队列:EMQX 6.0 背后的架构
MQTT 发布/订阅模式的局限性 规则引擎是 EMQX 内置的基于 SQL 的数据处理组件,专为物联网场景设计,能够高效、低成本地实现实时数据流转与处理。如今,大多数物联网系统看起…
-
人工智能驱动的视频编解码技术解析 | 灯塔智库
写在前面:视频数据作为视觉信息处理中最大的大数据类别,正以指数级速度增长,长期主导全球网络流量。新兴应用场景如超高清视频、交互式视频会议与远程屏幕共享,对视频编解码提出了更高要求。…
-
【音视频】如何埋点统计播放器卡顿率和卡顿时长
在对播放器进行性能埋点时,如何准确统计出每次播放的总的播放时长以及卡顿时长,从而准确统计播放卡顿率?
-
MPEG-H 和 Dolby Atmos 技术对比,广播公司更偏爱谁?
下一代音频 (NGA) 是一系列技术,它将音频从固定声道混音扩展到沉浸式、对象驱动和元数据驱动的体验,使其具有个性化、易用性和跨设备可扩展性。NGA 允许单个节目携带离散元素(声道…
-
异步 Django:将 WebSocket 扩展至 100 万并发连接
本文讲述如何实现将 WebSockets 扩展至 100 万并发连接,踩了哪些坑,以及在扩展异步 Django 应用过程中汲取的经验教训。
-
AAAI 2026|MARS:基于多模态检索和选择增强的对话LLM语音识别
随着以智能助手为代表的人机语音对话系统和会议转录与纪要等应用的爆发,对话语音识别(Conversational ASR) 技术变得愈发重要。对话语音(Conversational …
-
Android音视频性能优化技术
在资源有限的Android设备上进行音视频处理时,性能优化至关重要。AVSample项目展示了多项关键优化技术,可显著提升多媒体应用的性能。 1、原生库编译优化 项目针对FFmpe…
-
AI驱动的语音质量评分:衡量的不仅仅是MOS
在语音通信领域,通话质量不仅仅取决于技术规格,它直接反映了团队协作方式、客户服务体验以及企业日常运营。多年来,业界一直依赖平均意见得分 (MOS) 来衡量语音质量。尽管 MOS 确…
-
揭秘并解决直播延迟问题(直播延迟怎么解决)
媒体和娱乐行业近期最引人注目的市场趋势之一是流媒体直播的增长。全球流媒体直播市场从 2022 年的 12.4 亿美元增至 2023 年的 14.9 亿美元,复合年增长率(CAGR)…
-
【音视频】原生媒体播放器实现
本文探讨 AVSample 项目中的原生媒体播放器实现,该实现展示了如何使用 Android 原生 API 构建高性能的音频和视频播放器。
-
播放器视频后处理实践(二)氛围模式
百度播放内核团队将氛围模式效果应用到了视频播放场景,用于提升用户观看视频沉浸感,同时在百度App、好看App两款产品完成上线。本文将详细说明视频场景氛围模式技术方案。
-
【音视频】基于 Java 的媒体播放器
这个系列文章我们来介绍一位海外工程师如何探索安卓音视频基础技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍 Java 媒体播放器。 ——来自公众号“关键…
-
WebRTC在您离开时依然运行,Pion 中自动重选机制概述
视频通话的网络连接听起来很简单。你把视频发送到服务器,服务器再把视频发送回来。但这种思维模型在现实世界中会失效。一个最初在稳定的家庭Wi-Fi上建立的连接,可能会因为有人走出家门而…