技术文章

技术文章

FFmpeg 播放器入门教程（4）：线程分治

本教程分为 7 篇，将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器，非常适合初学者学习音视频开发。本文为第 4 篇：《FFmpeg 播放…

FFmpeg笔记
2025年4月3日
技术文章

FFmpeg 播放器入门教程（3）：播放音频

本教程分为 7 篇，将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器，非常适合初学者学习音视频开发。本文为第 3 篇：《FFmpeg 播放…

FFmpeg笔记
2025年4月2日
实时音视频

从缓冲到卓越质量：码率控制创新降低体育直播的成本和风险

无论是直播还是点播，在大规模提供最高质量的视频的同时尽量降低带宽成本始终是一大挑战。随着全球流媒体观众的不断增长，体育广播公司和流媒体平台正在寻求有效的方法来优化带宽，同时又不影响…

编解码
2025年4月2日
技术文章

视频压缩的未来：VVC 是否已准备就绪？

视频已成为我们数字生活的重要组成部分，推动着从娱乐到通信等各个领域的发展。然而，视频流的真正质量和效率取决于编解码器，这些编解码器可以显著减少表示视频所需的数据量。多功能视频编码（…

编解码
2025年4月1日
技术文章

FFmpeg 播放器入门教程（2）：输出视频到屏幕

本教程分为 7 篇，将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器，非常适合初学者学习音视频开发。——来自公众号“关键帧Keyframe…

FFmpeg笔记
2025年4月1日
技术文章

dpviz：开源电话系统FreePBX可视化工具

FreePBX是目前世界上部署最多的开源电话系统，支持了非常多的企业电话呼叫业务和运维功能。很多用户为开源FreePBX提供了多种创新型的功能模块，例如最近刚刚发布的可视化工具dp…

mazhu
2025年4月1日
技术文章

FLUX提速1.9X & LoRA热插拔！图像生成加速新标杆lyraDiff全面开源！

刚刚，腾讯天琴实验室在官微宣布 lyraDiff 全面开源，以下为全文内容。还在忍受原生Stable Diffusion与FLUX等文生图模型的龟速推理和显存与成本焦虑？第三方加…

大厂Animal
2025年3月31日
技术文章

FFmpeg 播放器入门教程（1）：截取视频帧

本教程分为 7 篇，将逐步讲解如何基于 FFmpeg 的 API 用 1000 行左右的代码开发一个简易播放器，非常适合初学者学习音视频开发。——来自公众号：关键帧Keyframe…

FFmpeg笔记
2025年3月31日
技术文章

PilotANN：基于图形的 ANNS 的 CPU-GPU 混合系统

近似最近邻搜索 (ANNS) 是一种基本的向量搜索技术，可以有效地识别高维向量空间中的相似项。传统上，ANNS 一直是检索引擎和推荐系统的骨干，但它很难跟上采用更高维嵌入和更大数据…

AIGC
2025年3月31日
WebRTC

webrtc如何进行后台录音

本文介绍：ogg格式详解；ogg的mux和demux的开源：推荐一个非常独立，移植性强的C++开源；
webrtc的录像怎么做(支持H264/H265/Vp8/Vp9/AV1编码)。

webrtc学习和实践
2025年3月31日
技术文章

人工智能语音合成：为虚拟形象创建逼真的数字声音

虚拟形象已不再只是屏幕上的动画角色，它们是我们的代表、助手，有时甚至是同伴。从视频游戏和客户支持机器人到虚拟影响者和元宇宙人物，这些虚拟形象都应以自然而令人信服的方式与用户互动。提…

虚拟现实
2025年3月28日
WebRTC

RFC 9725-WebRTC-HTTP接入协议（WHIP）正式成为RFC规范

WebRTC-HTTP接入协议（WHIP）正式成为RFC标准！这是基于WebRTC广播技术的重要里程碑事件。 WebRTC-HTTP Ingestion Protoco…

webrtc学习和实践
2025年3月28日
技术文章

OGG 与 MP3 有什么区别？哪种音频格式更好

本文将探讨数字音频格式的世界，比较 OGG 和 MP3。我们将讨论 OGG 和 MP3 的主要区别，包括音质、文件大小和兼容性等。什么是 OGG？ OGG 是一种免费的开源比特流…

音频技术
2025年3月28日
技术文章

TokenBridge：弥合可视化生成中连续和离散token表示法之间的差距

自回归视觉生成模型已成为一种突破性的图像合成方法，其灵感来自语言模型 token 预测机制。这些创新模型利用图像标记器将视觉内容转换为离散或连续 token。该方法促进了灵活的多模…

AIGC
2025年3月28日
技术文章

微帧WZVQA：极致还原人眼感知，精准评估视频画质

随着移动互联网的不断发展以及智能手机的普及，短视频已逐步取代图片和文字，跻身主流媒体形式的前列。短视频平台的兴起，让数十亿用户可以制作，分享并接收彼此的信息，为人们开辟了一条全新的…

视频技术
2025年3月27日
技术文章

Datoviz：基于 Vulkan 的超高速、高性能 GPU 科学可视化库

Datoviz 是一个跨平台、开源的高性能 GPU 科学数据可视化库，专为大规模数据集的交互式探索而设计。它采用 C/C++ 编写，基于 Khronos Vulkan® 图形 AP…

图像处理
2025年3月27日
即时通讯

开发实时消息系统的挑战和解决方案

社交媒体网络、服务市场和在线商店都在很大程度上依赖于实时消息传递，即时通信对于平台至关重要。实时互动加快了增长速度，促进了用户参与，因此消息传递功能对于任何企业在线成功都至关重要。…

ZEGO即构科技
2025年3月27日
技术文章

AAC 与 FLAC 音频编解码器的区别

当数字音频数据必须经过压缩才能存储和传输时，音频编解码器就派上用场了。AAC 是 iTunes 和 Apple Music 的默认编解码器，常用于流媒体音频。FLAC 则是一种无损…

编解码
2025年3月27日
技术文章

比特率与分辨率有什么区别(比特率与分辨率的关系)

有多种因素会影响视频流的质量，包括带宽、帧速率、文件大小、比特率、视频编解码器和分辨率。因此，在开始您的流媒体之旅之前，了解这些技术方面以及它们如何影响观看体验至关重要。比特率和…

视频技术
2025年3月26日
实时音视频

如何防止视频会议出现音频和视频延迟

从商务合作到社交互动，视频会议现已成为我们日常生活的重要组成部分。然而，在这些会议中，最令人沮丧的莫过于音频和视频的延迟。想象一下：你正在介绍一个重要的想法，而音频却出现了延迟，或…

ZEGO即构科技
2025年3月26日