技术文章
-
FFmpeg 播放器入门教程(7):Seeking
本教程分为 7 篇,将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器,非常适合初学者学习音视频开发。本文为第 7 篇:《FFmpeg 播放…
-
Android 16 将使媒体播放更加流畅
摘要:Android 16 通过减少解码视频或音频所需的进程数量,提高了媒体播放的效率。这是通过使用 Rust(一种更高效、更安全的语言)编写的媒体编解码器实现的。 即将推出的 A…
-
在浏览器中释放 FFmpeg 的威力:WebAssembly 视频处理指南
在 Web 开发领域,媒体处理一直是服务器端的任务。然而,随着 WebAssembly (WASM) 和 FFmpeg WASM 等库的出现,我们现在可以直接在浏览器中执行复杂的视…
-
FFmpeg 播放器入门教程(6):音频同步
本教程分为 7 篇,将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器,非常适合初学者学习音视频开发。本文为第 6 篇:《FFmpeg 播放…
-
开源PJSIP环境下回声抑制处理机制和优化讨论
回声消除或者回声抑制是语音呼叫中经常遇到的问题。这种问题取决于SIP终端的回声处理能力。很多SIP终端使用硬件处理,一些软电话只能使用软件算法来处理。处理的结果也有很大差别。本文章…
-
如何使用 JavaScript 创建 WebRTC UDP 连接
本文将介绍如何使用 JavaScript 创建 WebRTC UDP 连接的步骤。 第 1 步:要求 我们将使用 Node.js 服务器和普通浏览器 JavaScript 客户端。…
-
三款主流开源SIP软电话:MicroSIP、Linphone 和 JsSIP的全面技术场景使用分享
本文根据主流的三款开源SIP软电话:MicroSIP、Linphone 和 JsSIP 的特色、实现机制、适用场景、潜在技术问题及排查方法来帮助大家解读这些开源项目。
-
FFmpeg 播放器入门教程(5):视频同步
本教程分为 7 篇,将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器,非常适合初学者学习音视频开发。本文为第 5 篇:《FFmpeg 播放…
-
PJSIP 技术架构与核心注册模块工作机制分析
PJSIP 是一个功能强大、轻量级的开源SIP协议栈,广泛应用于VoIP、实时通信和嵌入式系统。它采用模块化设计,支持跨平台(Windows、Linux、macOS、iOS、And…
-
测量 OpenAI 基于 WebRTC 的实时 API 的响应延迟
从 Chrome 浏览器中提取的原始 RTP 数据包来测量总延迟,本文分析了这种方法在 OpenAI 的 WebRTC 实时 API 中的应用,并分析了结果。
-
减少大型视觉语言模型中的幻觉:潜在空间引导方法
幻觉仍然是部署大型视觉语言模型 (LVLM) 的一大挑战,因为这些模型通常会生成与视觉输入不一致的文本。与 LLM 中因语言不一致而产生的幻觉不同,LVLM 难以应对跨模态差异,导…
-
FFmpeg 播放器入门教程(4):线程分治
本教程分为 7 篇,将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器,非常适合初学者学习音视频开发。本文为第 4 篇:《FFmpeg 播放…
-
FFmpeg 播放器入门教程(3):播放音频
本教程分为 7 篇,将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器,非常适合初学者学习音视频开发。本文为第 3 篇:《FFmpeg 播放…
-
从缓冲到卓越质量:码率控制创新降低体育直播的成本和风险
无论是直播还是点播,在大规模提供最高质量的视频的同时尽量降低带宽成本始终是一大挑战。随着全球流媒体观众的不断增长,体育广播公司和流媒体平台正在寻求有效的方法来优化带宽,同时又不影响…
-
视频压缩的未来:VVC 是否已准备就绪?
视频已成为我们数字生活的重要组成部分,推动着从娱乐到通信等各个领域的发展。然而,视频流的真正质量和效率取决于编解码器,这些编解码器可以显著减少表示视频所需的数据量。多功能视频编码(…
-
FFmpeg 播放器入门教程(2):输出视频到屏幕
本教程分为 7 篇,将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器,非常适合初学者学习音视频开发。——来自公众号“关键帧Keyframe…
-
dpviz:开源电话系统FreePBX可视化工具
FreePBX是目前世界上部署最多的开源电话系统,支持了非常多的企业电话呼叫业务和运维功能。很多用户为开源FreePBX提供了多种创新型的功能模块,例如最近刚刚发布的可视化工具dp…
-
FLUX提速1.9X & LoRA热插拔!图像生成加速新标杆lyraDiff全面开源!
刚刚,腾讯天琴实验室在官微宣布 lyraDiff 全面开源,以下为全文内容。 还在忍受原生Stable Diffusion与FLUX等文生图模型的龟速推理和显存与成本焦虑?第三方加…
-
FFmpeg 播放器入门教程(1):截取视频帧
本教程分为 7 篇,将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器,非常适合初学者学习音视频开发。——来自公众号:关键帧Keyframe…
-
PilotANN:基于图形的 ANNS 的 CPU-GPU 混合系统
近似最近邻搜索 (ANNS) 是一种基本的向量搜索技术,可以有效地识别高维向量空间中的相似项。传统上,ANNS 一直是检索引擎和推荐系统的骨干,但它很难跟上采用更高维嵌入和更大数据…