技术文章
-
更智能的视频压缩如何创造可持续的未来
体育直播尤其容易受到气候变化的影响,从极端天气事件的干扰,到成本上升和物流挑战。随着减少体育媒体制作碳足迹的压力日益增大,编码和压缩技术正成为该行业更广泛的可持续发展努力中的有力工…
-
直播技术的未来:CXO 应该了解什么
在日益移动优先的世界里,移动应用程序开发服务对直播的未来至关重要。直播技术已成为一种强大的工具,改变着企业与客户、员工和利益相关者的互动方式。 对于 CXO(首席体验官、首席营销官…
-
B站:从拥塞控制算法热交换到内核错误修复
最近在哔哩哔哩,我们开发了一种改进的 BBR 拥塞控制算法,需要在真实环境中进行测试。该算法本身以内核模块的形式存在,因此将其安装到服务器上不是问题。然而,在快节奏的迭代过程中,我…
-
探索 FFmpeg Basics 音视频技术(10): 为视频添加文字
这个系列文章我们来介绍一位海外工程师如何探索 FFmpeg Basics 音视频技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 10 篇:FFmpeg …
-
AVS3标准首次亮相世俱杯直播,中国自主音视频技术迈入全球产业化新阶段
在近日举行的国际足联俱乐部世界杯(FIFA Club World Cup,简称:世俱杯)赛事中,中国自主研发的AVS3(The 3rd generation o…
-
节省 50% 带宽!英特尔 WebRTC H.265 实现在 Chrome 中默认启用
英特尔 Web 工程团队在 Chrome 浏览器 136 版实现默认启用 WebRTC H.265,通过在功率和性能方面的重大改进,可支持更流畅、更高效的流媒体体验。
-
可扩展且安全的边缘 AI 联邦学习架构
现代应用对实时数据处理和隐私保护的需求日益增长,边缘 AI (Edge AI) 成为人们关注的焦点。边缘 AI 是指将 AI 模型直接部署在边缘设备上,例如智能手机、物联网传感器、…
-
探索 FFmpeg Basics 音视频技术(9): 画中画 – overlay
Overlay 视频技术经常被使用。常见的例子包括放置在电视屏幕上的电视频道标志,通常位于右上角,用于标识特定频道。另一个例子是画中画功能,可以在主屏幕的一个角落显示一个小窗口。
-
IBM 的 MCP Gateway:基于 FastAPI 的统一模型上下文协议网关,适用于下一代 AI 工具链
高级 AI 系统的开发和部署越来越依赖于灵活、强大的编排层,这些编排层能够连接各种模型、工具和资源。IBM 的 MCP Gateway 满足了这一需求,它为模型上下文协议 (MCP…
-
探索 FFmpeg Basics 音视频技术(8): 模糊、锐化与其他降噪技术
这个系列文章我们来介绍一位海外工程师如何探索 FFmpeg Basics 音视频技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 8 篇:FFmpeg …
-
为什么小型语言模型(SLM)有望重新定义 Agentic AI:效率、成本和实际部署
LLM 因其类似人类的能力和对话技巧而广受推崇。然而,随着 Agentic AI 系统的快速发展,LLM 越来越多地被用于执行重复性、专业化的任务。这种转变势头强劲——超过一半的大…
-
WebRTC回音消除AECM的实现原理总结
本文对 WebRTC 音频处理模块 APM(Audio Processing Module)中针对回音消除问题的AECM解决方案进行技术理论和工作流程上的大致总结。
-
探索 FFmpeg Basics 音视频技术(7): 翻转和旋转视频
本文介绍 FFmpeg 如何翻转和旋转视频。翻转和旋转视频帧是常见的视觉操作,可用于创建各种有趣的效果,例如输入的镜像版本。
-
使用 WebSockets、Redis、Kafka 和 PostgreSQL 构建可扩展的聊天应用程序
从 WhatsApp 到多人游戏,实时通信为一切提供了动力。虽然搭建一个 WebSocket 服务器可能感觉像一个周末就能完成的项目,但如何将其扩展到数千个用户而不至于在负载下崩溃…
-
探索 FFmpeg Basics 音视频技术(6):填充视频
填充视频是指向视频帧添加额外区域以包含额外内容。当输入需要在具有不同宽高比的显示器上播放时,通常需要填充视频。
-
Twitch 的双布局直播:技术创新还是行业变革?
作为视频消费者,您在横屏(横向)和竖屏(纵向)之间的选择很可能受到您年龄的影响。如果您超过 40 岁,您可能会选择横屏观看。如果您比较年轻,则很可能默认为竖屏。 但作为视频制作者,…
-
探索 FFmpeg Basics 音视频技术(5):裁剪视频
裁剪视频是指从输入中选择想要的矩形区域到输出,不留下任何多余部分。裁剪通常用于调整大小、填充和其他编辑任务。
-
专利态势分析显示 Fraunhofer 和 Dolby 领先音频编解码器竞争
从高保真音乐流媒体到无缝视频会议,再到沉浸式虚拟现实环境,数字音频技术已成为现代通信和娱乐不可或缺的一部分。这一变革的核心是音频编解码器——一种先进的技术,用于对数字音频流进行编码…
-
探索 FFmpeg Basics 音视频技术(4):调整和伸缩视频
在FFmpeg中,调整视频的大小是指通过一个选项改变其宽度和高度,而缩放则意味着使用一个具有高级功能的scale滤镜来改变帧的大小。
-
Sakana AI 推出 Text-to-LoRA (T2L):基于任务文本描述生成特定任务 LLM 适配器 (LoRA) 的超级网络
Transformer 模型显著影响了 AI 系统处理自然语言理解、翻译和推理任务的方式。这些大型模型,尤其是大型语言模型 (LLM),在规模和复杂度上不断增长,如今已涵盖了各个领…