技术文章
-
OpenAI 发布开放权重 LLM:gpt-oss-120B(可在电脑上运行)和 gpt-oss-20B(可在手机上运行)
OpenAI 刚刚在 AI 领域掀起了一股震撼:自 2019 年 GPT-2 发布以来,该公司首次发布了不止一个,而是两个开放权重语言模型:GPT-OSS-120b 和 GPT-O…
-
B站是如何实现原声视频翻译的
BILIBILI Index 团队将系统性地介绍将中文视频翻译为外语的原声风格配音的技术架构与核心挑战,并分享他们在实践中如何逐步实现这些目标。
-
什么是AI工厂?AI工厂组成、应用场景及布局
在过去几年里,AI 的需求呈指数级增长。与网站和文件存储服务竞争传统数据中心提供的计算资源是不可持续的,尤其是随着 AI 模型变得越来越复杂,越来越多的行业采用这些模型。世界需要一…
-
播放器音频后处理实践(一)
本文内容聚焦在两项核心基础音效:重低音和清晰人声。分享两项音效的整体处理流程、关键滤镜链搭建方式、滤波器设计细节,以及如何在保证延迟与功耗可控的前提下,通过 FFmpeg 的 audio filter 机制灵活插拔各类处理节点。
-
LLM 中上下文工程的技术路线图:机制、基准和开放挑战
论文《大语言模型的上下文工程综述》将上下文工程确立为一门超越即时工程的正式学科,为设计、优化和管理指导大语言模型 (LLM) 的信息提供了一个统一的系统框架。 以下是其主要贡献和框…
-
如何使用 NestJS 作为 WebRTC 视频聊天的信令服务器
在本文中,我们将使用 WebRTC(用于浏览器直接通信)和 NestJS(作为信令服务器)构建一个点对点视频聊天应用程序。您将了解浏览器如何建立直接连接以及信令服务器在此过程中的作…
-
持续的观看体验质量需要采取积极主动的方法
如今的观众对播放问题的期望很高,但耐心却很少! 体验质量塑造品牌认知。如果视频启动缓慢、播放过程中缓冲或分辨率明显下降,就会迅速损害用户信任,引发负面评价,并最终导致订阅用户流失。…
-
动态 HDR 与视觉区分的未来
媒体公司正在投资高动态范围(HDR)技术,以提升消费者的观看体验,但许多业内人士开始质疑目前的实施是否真正发挥了该格式的潜力。可预测的制作工作流程往往依赖于压缩 HDR 信号的静态…
-
哔哩哔哩Android视频编辑页的架构升级
本文介绍了哔哩哔哩Android视频编辑页的架构升级。以轻量化的视频编辑为核心思路,从界面布局、用户交互、已有功能优化、新增必要功能等方面对编辑页进行改版。
-
用于在企业边缘实现敏捷 WAN 部署的容器化网络功能 (CNF)
随着企业加速数字化转型并在分布式环境中扩展运营,对敏捷、可扩展且经济高效的广域网 (WAN) 解决方案的需求日益增长。传统的以硬件为中心的网络功能正在被更灵活、软件定义的架构所取代…
-
2025嵌入式音视频入门技术栈
2025嵌入式音视频入门技术栈,汇总了视频和流媒体、音频方向的技术栈。
-
WebRTC SIP 集成:实时网络和电话通信的高级技术
将 WebRTC 和 SIP 结合在一起是连接现代 Web 应用和传统电话系统的一种有效方法。无论是在浏览器中启用语音和视频,还是将应用程序连接到 PBX 和 SIP 中继,Web…
-
微帧GPU视频硬编优化引擎:面向人工智能大时代的AI算法与硬编协同优化方案
GPU硬件视频编码是利用GPU的专用硬件单元,实现高效、低延迟的视频压缩与编码的技术,其核心优势在于通过并行计算能力显著提升编码速度,同时降低功耗。
-
每个 VoIP 专业人士都应该了解的 BGP
当您拨打 VoIP 电话或加入 UC(统一通信) 会议时,只需点击“呼叫”或“加入”按钮,一切就绪!您可以与远程员工、合作伙伴和客户无缝沟通。这看似不可思议,但在幕后,一项至关重要…
-
WebRTC 的 NetEQ 抖动缓冲如何提供流畅音频
这个系列文章我们来介绍一位海外工程师如何探索 WebRTC 音视频技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍测量 WebRTC 的 NetEQ 抖…
-
NVIDIA AI 开发团队发布 Llama Nemotron Super v1.5:为推理和代理 AI 树立新标准
人工智能领域持续快速发展,不断突破模型在推理、效率和应用多功能性方面的极限。NVIDIA 的最新版本 Llama Nemotron Super v1.5 在性能和可用性方面实现了显…
-
网易图形面试:Vulkan 和 OpenGL 渲染管线的区别
Vulkan 和 OpenGL 渲染管线的区别。一句话:OpenGL 是动态管线,Vulkan 是静态管线。
-
适配鸿蒙操作系统!腾讯游戏直播SDK基于Kuikly三端一码开发实践
随着鸿蒙Next的发布,越来越多的APP开始推进鸿蒙化适配,产品与技术团队也启动了游戏电竞直播SDK的鸿蒙适配规划。投入足够资源通常能达成适配目标,但仅实现技术目标的意义相对单薄 …
-
Python 中的 RTSP 流媒体入门:构建实时视频流的初学者指南
什么是 RTSP? 想象一下,您正在观看手机上的实时监控摄像头画面。视频是通过互联网实时传输给您的。在幕后,一种特殊的 “语言 ”帮助您的设备请求视频、播放、暂停,甚至是回放(如果…
-
Rheomesh:开源 WebRTC SFU 服务器 SDK
Rheomesh 是一个由 Rust 编写的 WebRTC SFU(选择性转发单元)库。它提供了一个 SDK 来帮助您构建 WebRTC SFU 服务器。此外,它还提供了使用 Ty…