技术文章
-
OpenAI 发布了 GPT-5:最智能、最快、最实用的 OpenAI 模型
OpenAI 刚刚发布了GPT-5,标志着生成式 AI 的重大飞跃,引入了可同时处理通用任务和高度专业化任务的高级功能。本文将深入探讨 GPT-5 的架构、新功能、性能改进以及其对…
-
InfiniBand 与 RoCEv2:为大规模 AI 选择合适的网络
GPU 是人工智能的基础计算引擎。然而,在大规模训练环境中,整体性能的限制并非在于处理速度,而是在于它们之间的网络通信速度。 大型语言模型需要在数千个 GPU 上进行训练,这会产生…
-
Peermetrics WebRTC 分析平台评测:开源监控与调试
WebRTC 应用程序面临着传统监控工具无法应对的独特运行挑战。与传统的网络应用不同,实时通信系统的运行需要复杂的点对点连接、动态网络条件和媒体处理管道,这些因素可能会无声无息地发…
-
使用 FFmpeg 和 Bash 自动处理视频帧和 HLS
大规模处理体育或赛事视频片段涉及一系列复杂、重复的任务,比如从分割视频到生成缩略图以及上传到云存储。在本文中,我们将使用 FFmpeg、AWS S3 和 PostgreSQL 探索…
-
轻松扩展直播:高效可靠地连接“中间一英里”
直播已成为媒体生态系统的基础组成部分。如今,无论观众是通过手机、平板电脑还是联网电视观看,他们都期望获得与主流广播公司同等的体验:高质量的视频、无缓冲、零中断。随着人们对流媒体内容…
-
OpenAI 发布开放权重 LLM:gpt-oss-120B(可在电脑上运行)和 gpt-oss-20B(可在手机上运行)
OpenAI 刚刚在 AI 领域掀起了一股震撼:自 2019 年 GPT-2 发布以来,该公司首次发布了不止一个,而是两个开放权重语言模型:GPT-OSS-120b 和 GPT-O…
-
B站是如何实现原声视频翻译的
BILIBILI Index 团队将系统性地介绍将中文视频翻译为外语的原声风格配音的技术架构与核心挑战,并分享他们在实践中如何逐步实现这些目标。
-
什么是AI工厂?AI工厂组成、应用场景及布局
在过去几年里,AI 的需求呈指数级增长。与网站和文件存储服务竞争传统数据中心提供的计算资源是不可持续的,尤其是随着 AI 模型变得越来越复杂,越来越多的行业采用这些模型。世界需要一…
-
播放器音频后处理实践(一)
本文内容聚焦在两项核心基础音效:重低音和清晰人声。分享两项音效的整体处理流程、关键滤镜链搭建方式、滤波器设计细节,以及如何在保证延迟与功耗可控的前提下,通过 FFmpeg 的 audio filter 机制灵活插拔各类处理节点。
-
LLM 中上下文工程的技术路线图:机制、基准和开放挑战
论文《大语言模型的上下文工程综述》将上下文工程确立为一门超越即时工程的正式学科,为设计、优化和管理指导大语言模型 (LLM) 的信息提供了一个统一的系统框架。 以下是其主要贡献和框…
-
如何使用 NestJS 作为 WebRTC 视频聊天的信令服务器
在本文中,我们将使用 WebRTC(用于浏览器直接通信)和 NestJS(作为信令服务器)构建一个点对点视频聊天应用程序。您将了解浏览器如何建立直接连接以及信令服务器在此过程中的作…
-
持续的观看体验质量需要采取积极主动的方法
如今的观众对播放问题的期望很高,但耐心却很少! 体验质量塑造品牌认知。如果视频启动缓慢、播放过程中缓冲或分辨率明显下降,就会迅速损害用户信任,引发负面评价,并最终导致订阅用户流失。…
-
动态 HDR 与视觉区分的未来
媒体公司正在投资高动态范围(HDR)技术,以提升消费者的观看体验,但许多业内人士开始质疑目前的实施是否真正发挥了该格式的潜力。可预测的制作工作流程往往依赖于压缩 HDR 信号的静态…
-
哔哩哔哩Android视频编辑页的架构升级
本文介绍了哔哩哔哩Android视频编辑页的架构升级。以轻量化的视频编辑为核心思路,从界面布局、用户交互、已有功能优化、新增必要功能等方面对编辑页进行改版。
-
用于在企业边缘实现敏捷 WAN 部署的容器化网络功能 (CNF)
随着企业加速数字化转型并在分布式环境中扩展运营,对敏捷、可扩展且经济高效的广域网 (WAN) 解决方案的需求日益增长。传统的以硬件为中心的网络功能正在被更灵活、软件定义的架构所取代…
-
2025嵌入式音视频入门技术栈
2025嵌入式音视频入门技术栈,汇总了视频和流媒体、音频方向的技术栈。
-
WebRTC SIP 集成:实时网络和电话通信的高级技术
将 WebRTC 和 SIP 结合在一起是连接现代 Web 应用和传统电话系统的一种有效方法。无论是在浏览器中启用语音和视频,还是将应用程序连接到 PBX 和 SIP 中继,Web…
-
微帧GPU视频硬编优化引擎:面向人工智能大时代的AI算法与硬编协同优化方案
GPU硬件视频编码是利用GPU的专用硬件单元,实现高效、低延迟的视频压缩与编码的技术,其核心优势在于通过并行计算能力显著提升编码速度,同时降低功耗。
-
每个 VoIP 专业人士都应该了解的 BGP
当您拨打 VoIP 电话或加入 UC(统一通信) 会议时,只需点击“呼叫”或“加入”按钮,一切就绪!您可以与远程员工、合作伙伴和客户无缝沟通。这看似不可思议,但在幕后,一项至关重要…
-
WebRTC 的 NetEQ 抖动缓冲如何提供流畅音频
这个系列文章我们来介绍一位海外工程师如何探索 WebRTC 音视频技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍测量 WebRTC 的 NetEQ 抖…