实时音视频
-
GenRTC:基于联合自适应编码与带宽估计实现的生成式实时视频会议系统 | TBC 2026
实时视频通信系统广泛发展,深入大众的日常生活。然而,现实世界的网络状况不总能令人满意,特别是在地铁或拥挤的公共场所等带宽受限的环境中,现有的实时通信(RTC)系统均难以维持最优性能…
-
为什么自动扩缩容可能会导致 RTC 通话中断(以及如何修复它)
自动扩缩容常被视为云效率的黄金标准。只需几行配置,即可实时调整基础设施以匹配流量,在节省成本的同时确保应用在高负载下稳定运行。但对于实时通信(RTC)应用,规则截然不同。 无论采用…
-
语聊房中的声浪效果是怎么实现的
在语聊房、K 歌房等实时音频场景中,我们经常能看到随着用户说话或唱歌,界面上会出现动态的声浪波形或音量柱状图。这种视觉反馈不仅让用户感知到音频正在传输,还能增强互动体验。那么,这种…
-
半岛电视台和 YouTube 的实时直播规模化解决方案
大型流媒体平台如何在重大新闻事件和突发新闻期间预判、配置并规划实时流量突发?半岛电视台高级流媒体架构师 Dilip Bharadwaj 与 YouTube 直播 OTT 工程主管 …
-
PyMKUI:ZLMediakit的现代化前端管理界面
PyMKUI是一个为ZLMediakit设计的现代化前端管理界面,提供了直观、美观的视频流管理功能。作为ZLMediakit的官方前端管理工具,PyMKUI为流媒体服务器的管理和监…
-
【音视频】客户端音视频超分
在移动端音视频领域,超分技术(Super Resolution, SR)已成为提升用户视觉体验、降低传输带宽成本的核心手段。对于 iOS 开发者而言,实现高效的超分方案不仅是算法的…
-
【音视频】C++ 实现视频编码与解码
在 Android NDK 开发中,直接使用 C++ 调用 MediaCodec 通常是为了追求极致性能或与现有的 FFmpeg/OpenGL 管道集成。自 A…
-
ICLR 2026 | 基于概念蒸馏的生成式视频复原算法Vivid-VR
本文介绍了由淘天音视频技术团队提出的一种名为Vivid-VR的生成式视频复原算法,该成果已被顶级会议ICLR 2026收录。针对现有基于扩散模型的视频复原方法在微调过程中容易出现的…
-
【音视频】基于 QP 的恒定画质控制指南
在 iOS 影像开发中,传统的比特率控制(ABR/VBR)往往在复杂动态画面或微距特写下产生“糊块”。要实现真正意义上的“清晰度一致”,必须深入底层控制 QP。 1、QP…
-
音视频技术已大幅提升,为何我们仍感受不到身临其境?
过去20年来,我们一直在以易于衡量的方式改进数字媒体。分辨率稳步提升,网络速度加快,延迟降低。几乎所有技术指标都取得了显著进步。然而,尽管取得了如此巨大的进步,我们的数字互动仍然感…
-
视频直播卡顿的原因(视频直播卡顿怎么解决)
视频直播卡顿是音视频开发者最为关注的问题之一。本文向开发者们介绍视频直播卡顿的主要原因,问题表现、常见场景、问题定位排查和解决方案,同时提供实际案例和预防措施,帮助开发者更好的解决…
-
大规模 RTSP 流媒体传输:架构和性能考量
尽管流媒体行业常聚焦于最新协议或 Flash 等已淘汰的旧标准,实时流媒体协议(RTSP)却正迎来巨大复兴。这并非因 RTSP 是突破性新技术,而是它始终是交通运输部门、执法机构及…
-
自主音视频技术优化落地,驱动移动视听新体验 | 广电视听科技亮点
如今,移动端高清视听已成主流,但以AVS3、HDR Vivid、Audio Vivid为代表的自主音视频技术,仍面临应用规模不足、移动端落地难等问题。为破解这一困境,广电总局设立中…
-
Globo、Starz 和 Paramount 如何保障传统设备上的流媒体体验
与其他高端流媒体平台类似,Starz 秉持“让所有人畅享”的理念,致力于为平台上的所有观众提供优质流媒体体验。但在支持流媒体早期遗留的庞杂设备与格式时,挑战层出不穷,尤其在关键的中…
-
如何向全球观众提供低延迟多视角体育赛事直播
在实现大规模低延迟直播面临诸多固有困难,且观众对尖端多视角体育观赛体验需求日益增长的背景下,多视角传输技术在流媒体传输中段这一关键环节带来了哪些额外挑战?像 Globo 这样的全球…
-
基于 ZEGO SDK 实现 Web 画中画音视频通话功能
画中画(Picture-in-Picture)功能允许您在浏览其他网页或使用其他应用时,继续观看视频通话内容。启用画中画后,通话界面将以独立的小窗口形式悬浮显示在屏幕最顶层。即使您…
-
音视频面试题集锦 54 期:WebRTC 相关面试题
分享来自“关键帧Keyframe”公众号的音视频面试题集锦 54 期之 WebRTC 面试题。 1、【连接与网络篇】当用户从 Wi-Fi 切换到 4G 网络时,WebRTC 的连接…
-
FFmpegKit 跨平台抽象层
FFmpegKit 中的跨平台抽象层代表了一种复杂的架构模式,它在保持平台特定优化的同时,实现了跨多个平台的一致 FFmpeg 功能。该抽象层作为统一 API 的基础,无论目标平台…
-
音视频 WebRTC 面试题 | 音视频面试题集锦 53 期
分享来自“关键帧Keyframe”的音视频面试题集锦第 53 期,本期内容主要是 WebRTC 音视频方面常见的 5 个面试题。 1、【架构与扩展篇】在多人视频会议场景中,SFU …
-
2026 流媒体预测:基础设施成为战略之年
2026 年的流媒体的 6 大趋势。视频已不再仅仅是媒介载体,而是构筑人类生存环境的基础设施。机构通过监控、分析关键视频数据并采取行动,这从根本上重塑了视频系统的构建与扩展模式。