技术文章 - 实时互动网第26页

技术文章

使用 FFmpeg 和 Bash 自动处理视频帧和 HLS

大规模处理体育或赛事视频片段涉及一系列复杂、重复的任务，比如从分割视频到生成缩略图以及上传到云存储。在本文中，我们将使用 FFmpeg、AWS S3 和 PostgreSQL 探索…

FFmpeg笔记

2025年8月6日

实时音视频

轻松扩展直播：高效可靠地连接“中间一英里”

直播已成为媒体生态系统的基础组成部分。如今，无论观众是通过手机、平板电脑还是联网电视观看，他们都期望获得与主流广播公司同等的体验：高质量的视频、无缓冲、零中断。随着人们对流媒体内容…

直播技术

2025年8月6日

技术文章

OpenAI 发布开放权重 LLM：gpt-oss-120B（可在电脑上运行）和 gpt-oss-20B（可在手机上运行）

OpenAI 刚刚在 AI 领域掀起了一股震撼：自 2019 年 GPT-2 发布以来，该公司首次发布了不止一个，而是两个开放权重语言模型：GPT-OSS-120b 和 GPT-O…

AIGC

2025年8月6日

技术文章

B站是如何实现原声视频翻译的

BILIBILI Index 团队将系统性地介绍将中文视频翻译为外语的原声风格配音的技术架构与核心挑战，并分享他们在实践中如何逐步实现这些目标。

大厂Animal

2025年8月5日

技术文章

什么是AI工厂？AI工厂组成、应用场景及布局

在过去几年里，AI 的需求呈指数级增长。与网站和文件存储服务竞争传统数据中心提供的计算资源是不可持续的，尤其是随着 AI 模型变得越来越复杂，越来越多的行业采用这些模型。世界需要一…

RTE基础设施

2025年8月5日

实时音视频

播放器音频后处理实践（一）

本文内容聚焦在两项核心基础音效：重低音和清晰人声。分享两项音效的整体处理流程、关键滤镜链搭建方式、滤波器设计细节，以及如何在保证延迟与功耗可控的前提下，通过 FFmpeg 的 audio filter 机制灵活插拔各类处理节点。

大厂Animal

2025年8月5日

技术文章

LLM 中上下文工程的技术路线图：机制、基准和开放挑战

论文《大语言模型的上下文工程综述》将上下文工程确立为一门超越即时工程的正式学科，为设计、优化和管理指导大语言模型 (LLM) 的信息提供了一个统一的系统框架。以下是其主要贡献和框…

AIGC

2025年8月5日

WebRTC

如何使用 NestJS 作为 WebRTC 视频聊天的信令服务器

在本文中，我们将使用 WebRTC（用于浏览器直接通信）和 NestJS（作为信令服务器）构建一个点对点视频聊天应用程序。您将了解浏览器如何建立直接连接以及信令服务器在此过程中的作…

webrtc学习和实践

2025年8月4日

技术文章

持续的观看体验质量需要采取积极主动的方法

如今的观众对播放问题的期望很高，但耐心却很少！体验质量塑造品牌认知。如果视频启动缓慢、播放过程中缓冲或分辨率明显下降，就会迅速损害用户信任，引发负面评价，并最终导致订阅用户流失。…

视频技术

2025年8月4日

技术文章

动态 HDR 与视觉区分的未来

媒体公司正在投资高动态范围（HDR）技术，以提升消费者的观看体验，但许多业内人士开始质疑目前的实施是否真正发挥了该格式的潜力。可预测的制作工作流程往往依赖于压缩 HDR 信号的静态…

视频技术

2025年8月4日

技术文章

哔哩哔哩Android视频编辑页的架构升级

本文介绍了哔哩哔哩Android视频编辑页的架构升级。以轻量化的视频编辑为核心思路，从界面布局、用户交互、已有功能优化、新增必要功能等方面对编辑页进行改版。

大厂Animal

2025年8月1日

技术文章

用于在企业边缘实现敏捷 WAN 部署的容器化网络功能 (CNF)

随着企业加速数字化转型并在分布式环境中扩展运营，对敏捷、可扩展且经济高效的广域网 (WAN) 解决方案的需求日益增长。传统的以硬件为中心的网络功能正在被更灵活、软件定义的架构所取代…

RTE基础设施

2025年8月1日

实时音视频

2025嵌入式音视频入门技术栈

2025嵌入式音视频入门技术栈，汇总了视频和流媒体、音频方向的技术栈。

RTC观主

2025年7月31日

WebRTC

WebRTC SIP 集成：实时网络和电话通信的高级技术

将 WebRTC 和 SIP 结合在一起是连接现代 Web 应用和传统电话系统的一种有效方法。无论是在浏览器中启用语音和视频，还是将应用程序连接到 PBX 和 SIP 中继，Web…

webrtc学习和实践

2025年7月31日

技术文章

微帧GPU视频硬编优化引擎：面向人工智能大时代的AI算法与硬编协同优化方案

GPU硬件视频编码是利用GPU的专用硬件单元，实现高效、低延迟的视频压缩与编码的技术，其核心优势在于通过并行计算能力显著提升编码速度，同时降低功耗。

编解码

2025年7月31日

技术文章

每个 VoIP 专业人士都应该了解的 BGP

当您拨打 VoIP 电话或加入 UC（统一通信）会议时，只需点击“呼叫”或“加入”按钮，一切就绪！您可以与远程员工、合作伙伴和客户无缝沟通。这看似不可思议，但在幕后，一项至关重要…

RTE基础设施

2025年7月30日

WebRTC

WebRTC 的 NetEQ 抖动缓冲如何提供流畅音频

这个系列文章我们来介绍一位海外工程师如何探索 WebRTC 音视频技术，对于想要开始学习音视频技术的朋友，这些文章是份不错的入门资料，本篇介绍测量 WebRTC 的 NetEQ 抖…

RTC观主

2025年7月29日

技术文章

NVIDIA AI 开发团队发布 Llama Nemotron Super v1.5：为推理和代理 AI 树立新标准

人工智能领域持续快速发展，不断突破模型在推理、效率和应用多功能性方面的极限。NVIDIA 的最新版本 Llama Nemotron Super v1.5 在性能和可用性方面实现了显…

AIGC

2025年7月29日

技术文章

网易图形面试：Vulkan 和 OpenGL 渲染管线的区别

Vulkan 和 OpenGL 渲染管线的区别。一句话：OpenGL 是动态管线，Vulkan 是静态管线。

字节流动

2025年7月29日

实时音视频

适配鸿蒙操作系统！腾讯游戏直播SDK基于Kuikly三端一码开发实践

随着鸿蒙Next的发布，越来越多的APP开始推进鸿蒙化适配，产品与技术团队也启动了游戏电竞直播SDK的鸿蒙适配规划。投入足够资源通常能达成适配目标，但仅实现技术目标的意义相对单薄 …

大厂Animal

2025年7月28日