实时音视频
-
【音视频】客户端音视频超分
在移动端音视频领域,超分技术(Super Resolution, SR)已成为提升用户视觉体验、降低传输带宽成本的核心手段。对于 iOS 开发者而言,实现高效的超分方案不仅是算法的…
-
【音视频】C++ 实现视频编码与解码
在 Android NDK 开发中,直接使用 C++ 调用 MediaCodec 通常是为了追求极致性能或与现有的 FFmpeg/OpenGL 管道集成。自 A…
-
ICLR 2026 | 基于概念蒸馏的生成式视频复原算法Vivid-VR
本文介绍了由淘天音视频技术团队提出的一种名为Vivid-VR的生成式视频复原算法,该成果已被顶级会议ICLR 2026收录。针对现有基于扩散模型的视频复原方法在微调过程中容易出现的…
-
【音视频】基于 QP 的恒定画质控制指南
在 iOS 影像开发中,传统的比特率控制(ABR/VBR)往往在复杂动态画面或微距特写下产生“糊块”。要实现真正意义上的“清晰度一致”,必须深入底层控制 QP。 1、QP…
-
音视频技术已大幅提升,为何我们仍感受不到身临其境?
过去20年来,我们一直在以易于衡量的方式改进数字媒体。分辨率稳步提升,网络速度加快,延迟降低。几乎所有技术指标都取得了显著进步。然而,尽管取得了如此巨大的进步,我们的数字互动仍然感…
-
视频直播卡顿的原因(视频直播卡顿怎么解决)
视频直播卡顿是音视频开发者最为关注的问题之一。本文向开发者们介绍视频直播卡顿的主要原因,问题表现、常见场景、问题定位排查和解决方案,同时提供实际案例和预防措施,帮助开发者更好的解决…
-
大规模 RTSP 流媒体传输:架构和性能考量
尽管流媒体行业常聚焦于最新协议或 Flash 等已淘汰的旧标准,实时流媒体协议(RTSP)却正迎来巨大复兴。这并非因 RTSP 是突破性新技术,而是它始终是交通运输部门、执法机构及…
-
自主音视频技术优化落地,驱动移动视听新体验 | 广电视听科技亮点
如今,移动端高清视听已成主流,但以AVS3、HDR Vivid、Audio Vivid为代表的自主音视频技术,仍面临应用规模不足、移动端落地难等问题。为破解这一困境,广电总局设立中…
-
Globo、Starz 和 Paramount 如何保障传统设备上的流媒体体验
与其他高端流媒体平台类似,Starz 秉持“让所有人畅享”的理念,致力于为平台上的所有观众提供优质流媒体体验。但在支持流媒体早期遗留的庞杂设备与格式时,挑战层出不穷,尤其在关键的中…
-
如何向全球观众提供低延迟多视角体育赛事直播
在实现大规模低延迟直播面临诸多固有困难,且观众对尖端多视角体育观赛体验需求日益增长的背景下,多视角传输技术在流媒体传输中段这一关键环节带来了哪些额外挑战?像 Globo 这样的全球…
-
基于 ZEGO SDK 实现 Web 画中画音视频通话功能
画中画(Picture-in-Picture)功能允许您在浏览其他网页或使用其他应用时,继续观看视频通话内容。启用画中画后,通话界面将以独立的小窗口形式悬浮显示在屏幕最顶层。即使您…
-
音视频面试题集锦 54 期:WebRTC 相关面试题
分享来自“关键帧Keyframe”公众号的音视频面试题集锦 54 期之 WebRTC 面试题。 1、【连接与网络篇】当用户从 Wi-Fi 切换到 4G 网络时,WebRTC 的连接…
-
FFmpegKit 跨平台抽象层
FFmpegKit 中的跨平台抽象层代表了一种复杂的架构模式,它在保持平台特定优化的同时,实现了跨多个平台的一致 FFmpeg 功能。该抽象层作为统一 API 的基础,无论目标平台…
-
音视频 WebRTC 面试题 | 音视频面试题集锦 53 期
分享来自“关键帧Keyframe”的音视频面试题集锦第 53 期,本期内容主要是 WebRTC 音视频方面常见的 5 个面试题。 1、【架构与扩展篇】在多人视频会议场景中,SFU …
-
2026 流媒体预测:基础设施成为战略之年
2026 年的流媒体的 6 大趋势。视频已不再仅仅是媒介载体,而是构筑人类生存环境的基础设施。机构通过监控、分析关键视频数据并采取行动,这从根本上重塑了视频系统的构建与扩展模式。
-
音视频 Android 面试题 | 音视频面试题集锦 51 期
来自”关键帧Keyframe”整理的音视频面试题集锦第 51 期之音视频 Android 面试题。 1、【渲染架构篇】SurfaceView 和 Texture…
-
如何靠音视频体验突围增长?即构推出AI音视频能力矩阵
近日,即构整合沉淀多年的音视频处理算法,推出AI音视频能力矩阵,用硬核算法破解音视频痛点,更精准适配多元场景,让音视频算法落地到实际业务中。 实测客户接入后用户数量显著增长,效益增…
-
如何在 iOS 中将多张 WebP 图像转换为视频
在 iOS 中将多张 WebP 图像(通常是动图或序列帧)转换为视频,核心逻辑是利用 AVAssetWriter 将解码后的像素数据(CVPixelBuffer…
-
音视频 iOS 面试题 | 音视频面试题集锦 49 期
来自”关键帧Keyframe”整理的音视频面试题集锦第 49 期之音视频 iOS 面试题。 1、【原理篇】请详述音视频同步(AVSync)的策略。如果视频播…
-
Streaming Media 2025 Highlights 系列报道 5:关于编解码和游戏化真人秀
本文为Streaming Media 2025 Highlights的总结报道的第五篇,包括2段访谈。 分别是《诺基亚的Ville-Veikko Mattila谈Ericsson-…