技术文章

实时音视频

更智能的视频压缩如何创造可持续的未来

体育直播尤其容易受到气候变化的影响，从极端天气事件的干扰，到成本上升和物流挑战。随着减少体育媒体制作碳足迹的压力日益增大，编码和压缩技术正成为该行业更广泛的可持续发展努力中的有力工…

编解码
2025年6月24日
实时音视频

直播技术的未来：CXO 应该了解什么

在日益移动优先的世界里，移动应用程序开发服务对直播的未来至关重要。直播技术已成为一种强大的工具，改变着企业与客户、员工和利益相关者的互动方式。对于 CXO（首席体验官、首席营销官…

ZEGO即构科技
2025年6月24日
技术文章

B站：从拥塞控制算法热交换到内核错误修复

最近在哔哩哔哩，我们开发了一种改进的 BBR 拥塞控制算法，需要在真实环境中进行测试。该算法本身以内核模块的形式存在，因此将其安装到服务器上不是问题。然而，在快节奏的迭代过程中，我…

大厂Animal
2025年6月24日
实时音视频

探索 FFmpeg Basics 音视频技术（10）：为视频添加文字

这个系列文章我们来介绍一位海外工程师如何探索 FFmpeg Basics 音视频技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，这是第 10 篇：FFmpeg …

RTC观主
2025年6月24日
实时音视频

AVS3标准首次亮相世俱杯直播，中国自主音视频技术迈入全球产业化新阶段

在近日举行的国际足联俱乐部世界杯（FIFA Club World Cup，简称：世俱杯）赛事中，中国自主研发的AVS3（The 3rd generation o…

编解码
2025年6月24日
WebRTC

节省 50% 带宽！英特尔 WebRTC H.265 实现在 Chrome 中默认启用

英特尔 Web 工程团队在 Chrome 浏览器 136 版实现默认启用 WebRTC H.265，通过在功率和性能方面的重大改进，可支持更流畅、更高效的流媒体体验。

大厂Animal
2025年6月23日
技术文章

可扩展且安全的边缘 AI 联邦学习架构

现代应用对实时数据处理和隐私保护的需求日益增长，边缘 AI (Edge AI) 成为人们关注的焦点。边缘 AI 是指将 AI 模型直接部署在边缘设备上，例如智能手机、物联网传感器、…

RTE基础设施
2025年6月23日
实时音视频

探索 FFmpeg Basics 音视频技术（9）：画中画 – overlay

Overlay 视频技术经常被使用。常见的例子包括放置在电视屏幕上的电视频道标志，通常位于右上角，用于标识特定频道。另一个例子是画中画功能，可以在主屏幕的一个角落显示一个小窗口。

RTC观主
2025年6月23日
技术文章

IBM 的 MCP Gateway：基于 FastAPI 的统一模型上下文协议网关，适用于下一代 AI 工具链

高级 AI 系统的开发和部署越来越依赖于灵活、强大的编排层，这些编排层能够连接各种模型、工具和资源。IBM 的 MCP Gateway 满足了这一需求，它为模型上下文协议 (MCP…

AIGC
2025年6月23日
实时音视频

探索 FFmpeg Basics 音视频技术（8）：模糊、锐化与其他降噪技术

这个系列文章我们来介绍一位海外工程师如何探索 FFmpeg Basics 音视频技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，这是第 8 篇：FFmpeg …

RTC观主
2025年6月20日
技术文章

为什么小型语言模型（SLM）有望重新定义 Agentic AI：效率、成本和实际部署

LLM 因其类似人类的能力和对话技巧而广受推崇。然而，随着 Agentic AI 系统的快速发展，LLM 越来越多地被用于执行重复性、专业化的任务。这种转变势头强劲——超过一半的大…

AIGC
2025年6月19日
WebRTC

WebRTC回音消除AECM的实现原理总结

本文对 WebRTC 音频处理模块 APM（Audio Processing Module）中针对回音消除问题的AECM解决方案进行技术理论和工作流程上的大致总结。

webrtc学习和实践
2025年6月19日
实时音视频

探索 FFmpeg Basics 音视频技术（7）：翻转和旋转视频

本文介绍 FFmpeg 如何翻转和旋转视频。翻转和旋转视频帧是常见的视觉操作，可用于创建各种有趣的效果，例如输入的镜像版本。

RTC观主
2025年6月19日
即时通讯

使用 WebSockets、Redis、Kafka 和 PostgreSQL 构建可扩展的聊天应用程序

从 WhatsApp 到多人游戏，实时通信为一切提供了动力。虽然搭建一个 WebSocket 服务器可能感觉像一个周末就能完成的项目，但如何将其扩展到数千个用户而不至于在负载下崩溃…

IM开发老王
2025年6月18日
实时音视频

探索 FFmpeg Basics 音视频技术（6）：填充视频

填充视频是指向视频帧添加额外区域以包含额外内容。当输入需要在具有不同宽高比的显示器上播放时，通常需要填充视频。

RTC观主
2025年6月18日
实时音视频

Twitch 的双布局直播：技术创新还是行业变革？

作为视频消费者，您在横屏(横向)和竖屏(纵向)之间的选择很可能受到您年龄的影响。如果您超过 40 岁，您可能会选择横屏观看。如果您比较年轻，则很可能默认为竖屏。但作为视频制作者，…

直播技术
2025年6月17日
实时音视频

探索 FFmpeg Basics 音视频技术（5）：裁剪视频

裁剪视频是指从输入中选择想要的矩形区域到输出，不留下任何多余部分。裁剪通常用于调整大小、填充和其他编辑任务。

RTC观主
2025年6月17日
实时音视频

专利态势分析显示 Fraunhofer 和 Dolby 领先音频编解码器竞争

从高保真音乐流媒体到无缝视频会议，再到沉浸式虚拟现实环境，数字音频技术已成为现代通信和娱乐不可或缺的一部分。这一变革的核心是音频编解码器——一种先进的技术，用于对数字音频流进行编码…

编解码
2025年6月16日
实时音视频

探索 FFmpeg Basics 音视频技术（4）：调整和伸缩视频

在FFmpeg中，调整视频的大小是指通过一个选项改变其宽度和高度，而缩放则意味着使用一个具有高级功能的scale滤镜来改变帧的大小。

RTC观主
2025年6月16日
技术文章

Sakana AI 推出 Text-to-LoRA (T2L)：基于任务文本描述生成特定任务 LLM 适配器 (LoRA) 的超级网络

Transformer 模型显著影响了 AI 系统处理自然语言理解、翻译和推理任务的方式。这些大型模型，尤其是大型语言模型 (LLM)，在规模和复杂度上不断增长，如今已涵盖了各个领…

AIGC
2025年6月16日