技术文章
-
通过 CDN 实现低延迟流媒体:如何优化 LL-HLS 和 LL-DASH 以实现低于 3 秒的延迟
直播技术正在不断演进,观众如今期待近乎即时的播放体验。Gcore 推出低延迟直播解决方案,通过采用 LL-HLS 和 LL-DASH 技术,实现端到端 2.0-3.0秒的延迟。该方…
-
评估基于 LLM 的语音助手:超越传统指标的指南
这是一份实用指南,指导如何使用涵盖实用性、准确性、安全性和系统性能的多维指标来评估基于 LLM 的语音助手。
-
为 AI 时代升级 H.26x 视频编码功能
作者:Miska Hannuksela,Jill Boyce译自:https://www.nokia.com/blog/upgrading-h26x-video-coding-fe…
-
体积视频如何将3D渲染视频变为现实
诺基亚技术公司体积视频编码首席工程师兼技术负责人劳里·伊洛拉解释了体积视频如何推动增强现实和扩展现实领域的新应用。
-
如何为 WebRTC 设置安全的 TURN 服务器(Coturn)
本文讲介绍如何自行部署 TURN 服务器,以实现安全、私密且具备生产环境就绪性的解决方案。
-
大语言模型能够理解空间音频吗?
清华大学、剑桥大学与字节跳动的研究团队提出了一种让大语言模型(LLM)理解空间音频的新方法。与当前多模态大模型只能解析普通音频不同,这项工作让 LLM 有初步“听懂”三维空间中声音方向与定位的能力。
-
95% 的互联网用户已使用即时通讯应用:这是最普遍的数字化习惯
数字世界中有一位无可争议的王者:移动即时通讯。根据 Statista 的数据,全球超过 94.5% 的互联网用户每月都会使用聊天应用程序。这一数字使即时通讯成为最普及的数字活动,其…
-
LongCat-Flash-Omni 正式发布并开源:开启全模态实时交互时代
自9月1日,美团正式发布 LongCat-Flash 系列模型,现已开源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 两大版本,获得了开…
-
AV1 运动矢量保真度实现高效的光流估计,作为高质量替代方案
运动估计是计算机视觉任务中至关重要却计算密集的环节,研究人员一直在寻求提高其效率的方法。 来自都柏林圣三一学院的 Julien Zouein、Vibhoothi Vibhoothi…
-
流媒体服务商为何应采用统一可观测性策略以避免代价高昂的网站故障
在超级碗、格莱美颁奖礼和奥运会等重大直播活动中,观众期待的是清晰流畅、实时无中断的观赛体验。数百万观众同时收看,广告商更是不惜重金将产品展示在观众眼前。幕后,这给流媒体服务商带来了…
-
什么是毫秒级延迟直播?毫秒级延迟直播方案有哪些
在流媒体领域,”延迟 “是指视频或音频数据从源传输到观众设备的延迟时间。试想一下,在观看足球比赛等直播活动时,在您的流媒体上看到进球发生之前,您的邻居就已经…
-
音视频网络传输优化
这个系列文章我们来介绍音视频相关面试题,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,本篇介绍网络传输优化。 ——来自公众号“关键帧Keyframe”的分享 1、优…
-
《Agentic Design Patterns:构建智能系统的实战指南》- 第十章 模型上下文协议
本文是对《智能体设计模式》第十章的翻译。此章节介绍了模型上下文协议(MCP协议)。
-
触手可及:触觉技术成为虚拟现场体验的核心
整个视频行业,尤其是体育行业,正在走向多模态化。随着行业将分辨率、动态范围和音频保真度提升至难以进一步变现的高度,单纯的画面和音频已无法满足需求。因此,业界正将目光投向能增强赛…
-
如何构建视频面试平台?
您是否了解一款能让招聘变得智能高效、不受地域限制的视频面试平台?该系统能更便捷快速地开展常规面试,助您发掘最优秀的候选人。若您想了解如何构建视频面试平台,本文将介绍其核心功能、使用…
-
常用 Web 实时通信技术:原理+选型,一篇通关
在 Web 开发中,实时通信技术的核心目标是实现客户端(Browser)与服务器之间低延迟、双向 / 单向的动态数据交互,而非传统 HTTP 的 “请求 – 响应” 模…
-
《Agentic Design Patterns:构建智能系统的实战指南》- 第九章 学习与适应
本文是对《智能体设计模式》第九章的翻译。此章节介绍了支撑智能体学习与适应的原理和机制。
-
非极客实时 AI 视频增强指南
本文分享 Pixop 的技术专家 Jon Frydensbjerg 眼中的 AI 视频增强。全文如下。 致真正的非技术人士:本文同样面向非技术读者,据说并非所有人都知道“精灵(Sp…
-
观点:IPMX 是否正在取代 ST 2110?
IPMX(IP Media Experience)会取代 SMTE ST 2110 吗? 不会,至少目前来说,它们针对的是不同的应用领域。IPMX是“简化版ST 2110(且可能更…
-
音视频面试题集锦第 42 期 | Android 音视频方向面试题实录
本文来自音视频技术社群关键帧的音视频开发圈的分享,该社群会定期整理一些音视频相关的面试题,本期分享 Android 音视频方向面试题实录。 下面是我们技术社群的一位群友最近面试 J…