实时音视频
-
基于 SRT 协议的安全推流整合方案在云手机产品中的应用
为落实国家“十四五”数字经济与新型基础设施建设规划,遵循数据安全法和个人信息保护法的相关要求,推动云手机安全传输技术国产化与标准化,针对云手机音视频流传输的高丢包、低安全与延迟等问…
-
【音视频】媒体播放器缓冲策略
这个系列文章我们来介绍音视频相关面试题,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍媒体播放器缓冲策略。 ——来自公众号“关键帧Keyframe”的分享 …
-
视频编码标准中的随机访问(random access)
每当你在视频流中跳转到想要的场景、在稍后时间继续观看电影、切换电视频道,或是加入已经开始的视频会议时,你都在使用一种名为随机访问(random access)的视频解码功能。
-
【音视频】面试题集锦第 41 期
音视频面试题集锦第 41 期。涉及 AV1、vp8 和 vp9、优化播放器、hls 直播、转码、播放器秒开率和消息队列等方面知识。
-
火山引擎多媒体实验室画质理解大模型 Q-Insight 入选 NeurIPS 2025 Spotlight
近日,NeurIPS 2025公布了录用结果,该会议是机器学习与人工智能领域最具影响力的国际顶级学术会议之一。据悉本次会议共有21575篇投稿进入审稿阶段,最终5290篇论文被录用…
-
【音视频】构建视频播放器
这个系列文章我们来介绍音视频相关面试题,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍构建视频播放器。 ——来自公众号“关键帧Keyframe”的分享 学习…
-
全球沟通零“时差”,腾讯云TRTC 实时翻译AI引擎,全链路助推企业突破“无感”瓶颈
在数字化浪潮和全球化进程的双重驱动下,线上线下的沟通触点倍速增长,跨语言沟通场景在我们的生活、工作中愈发普遍。但常见的翻译工具仍以“说一句、停一下”的回合制翻译为主,机械化、响应慢…
-
libavcodec:音视频编码与解码
本文深入探讨了 FFmpeg 中 libavcodec 库的核心功能——音视频编码与解码。我们将从基础概念出发,逐步解析其工作原理、关键数据结构、API 使用流程,并通过实际代码示…
-
libavfilter 音视频处理
本文全面介绍 FFmpeg 中 libavfilter 库的使用方法与核心原理。libavfilter 提供了一套强大的音视频滤镜框架,支持从简单的裁剪、缩放到复杂的音频混合、视频…
-
【音视频】libavformat 容器格式处理
libavformat 是 FFmpeg 框架中的核心库之一,专门负责处理各种媒体容器格式的解复用(demuxing)和复用(muxing)操作。它为音视频数据的读取和写入提供了统…
-
ZEGO AI 数字人伴学互动方案
ZEGO AI 数字人伴学互动方案,通过 AI Agent + 数字人 + RTC 三位一体的技术架构,用AI 数字人教师代替真人老师,实现学生个性化的口语互动,并给出个性化的反馈,提升学习效果。
-
Jitsi Meet 推出 Receiver Audio 订阅服务
Jitsi Meet 长期支持视频 ReceiverConstraints 功能。接收方可指定希望接收的视频流及其分辨率,后端将在可用带宽范围内尽力满足这些约束。但音频方面此前缺乏…
-
OpenVidu Meet:一款基于 OpenVidu 构建的虚拟会议自托管解决方案
OpenVidu Meet 是一款基于 OpenVidu 构建的完整视频通话服务,旨在为虚拟会议提供易于使用的自主托管解决方案。
-
探索 Vulkan 音视频技术(11):平台特定实现
在开发跨平台 Vulkan 应用程序时,处理平台特定差异对于确保代码在不同操作系统上无缝运行至关重要。SaschaWillems/Vulkan 仓库展示了一种优雅的平台抽象方法,使相同的 Vulkan 示例能够在不同平台上运行。
-
探索 Vulkan 音视频技术(10):GLSL着色器指南
着色器是任何 Vulkan 应用程序的核心,定义了图形和计算操作如何在 GPU 上执行。本文将带你了解着色器结构、编译工作流以及整个示例中使用的集成模式。
-
探索 Vulkan 音视频技术(9):性能优化示例
性能优化对于创建能够充分利用现代 GPU 硬件的高性能 Vulkan 应用程序至关重要。本文将探讨SaschaWillems/Vulkan 仓库中可用的关键性能优化示例,并解释如何在自己的应用程序中利用这些技术。
-
实时语音活动检测:兼顾精度与计算量的平衡之道
本文介绍一种实时基于统计模型的VAD算法,与WebRTC VAD流程解析中不同,这里可以复用ANR噪声估计的结果进行判决,在算力受限的端侧设备上是一个不错的选择。
-
探索 Vulkan 音视频技术(8):计算着色器应用
本文探索 SaschaWillems/Vulkan 仓库中的计算着色器示例,展示如何实现从图像处理到粒子模拟的各种计算密集型应用。
-
探索 Vulkan 音视频技术(7):光线追踪示例
光线追踪代表了渲染技术的范式转变,超越了传统的光栅化,转而模拟光的物理行为。SaschaWillems/Vulkan 仓库提供了全面的光线追踪示例集合。
-
B 帧对视频清晰度 / 码率的影响
在 H.264/AVC 视频编码标准的 Extended Profile(扩展档次)中,B 帧(Bidirectional Predictive Frame)作为帧间压缩的核心技术…