-
2026年实时音视频如何重塑”一起冥想”体验:纯净人声、空间音效与AI引导的技术落地
“一起冥想”是一种多人在线、同步进行的引导式冥想场景,其核心技术诉求是纯净人声、低延迟同步、沉浸式空间音效与稳定的多人房间。借助即构科技(ZEGO) 实时音…
-
语音增强中的自监督学习:从无配对训练到基础模型先验
语音增强中的 SSL 已经不再只是“监督数据不够时的权宜之计”,SE 的研究范式已经发生明显变化。对于 SE 而言,自监督学习真正带来的,不只是更少标签,而是更强先验与更宽系统设计空间。
-
Elly推出AI招聘助手,将对话式招聘和外联整合到一个招聘系统中
2026年6月2日,AI 原生招聘平台 Elly 宣布正式推出 AI Sourcer,这是一个直接集成到 Elly 平台中的对话式人才搜寻和拓展工作流程。AI Sourcer 将基…
-
从任意视角探索场景:3D体积视频技术突破意味着3D流媒体可能很快成为现实
布朗大学的研究人员公布了一种名为 PackUV 的全新视频处理方法,他们将其描述为实现逼真、可存储的3D 体积视频的“关键一步”,这种视频可以从各个角度观看,并且与目前互联网上大多…
-
苹果和谷歌悄然开发了一种新的HDR标准:Eclipse Video
出人意料的是,继 Eclipsa Audio 之后,苹果、谷歌和 NBCUniversal 与 SMPTE 合作,开发了一种名为 Eclipsa Video 的全新 HDR 视频标…
-
腾讯云与Soniox建立战略合作伙伴关系,共同助力全球多语言语音AI应用发展
今日,腾讯云宣布与总部位于旧金山的语音 AI 公司Soniox建立战略合作伙伴关系。Soniox 专注于开发高精度、低延迟的语音 AI 解决方案。 此次合作将 Soniox 的语…
-
思科发布统一的WEM套件,用于管理人工和AI联络中心座席
思科推出了统一的劳动力互动管理 (WEM) 套件,为 Webex 联系中心内的人工和 AI 代理提供了一个统一的管理平台。 该套件包括劳动力管理 (WFM) 和质量管理 (QM) …
-
分析:AI 助手在回答流媒体可用性查询方面表现不一致
一项针对流媒体影片可用性数据的受控准确率分析发现,在对100部热门美国影片进行人工验证的真实数据进行测试时,ChatGPT的准确率为43.76%,Claude的准确率为50.21%…
-
Lumine Group 达成协议,将从 Synamedia 收购其视频网络业务
2026年6月2日,Lumine Group 是一家专注于长期持有通信及媒体软件业务的全球收购方,今日宣布已通过其子公司签署协议,将从 Synamedia 收购其视频网络业务(Sy…
-
Snowflake 收购 Natoma 以扩展 AI 代理治理
Snowflake上周宣布计划收购企业模型上下文协议平台 Natoma,这是其向智能体企业迈出的最新一步。此次收购将使 Snowflake 的治理范围扩展到 AI 代理和企业工作流…
-
流畅多人游戏背后的基础设施
从表面上看,实时多人游戏似乎轻而易举。玩家点击一个按钮,角色便在共享的世界中移动,而其他上百名用户能在几毫秒内看到这一动作。但幕后发生的事情要复杂得多。那是一套由网络技术、服务器架…
-
waipu.tv 在世界杯足球赛前推出低延迟流媒体模式
德国电视流媒体提供商 waipu.tv 推出了一项新的低延迟流媒体技术,旨在减少 2026 年 FIFA 足球世界杯期间的直播延迟。 全新的“体育模式”可加快直播电视信号的传输速度…
-
Shotcut 26.6 Beta 版带来多项修复,并支持 OpenFX 和 VST2 插件
Shotcut 26.6 现已推出测试版,这是这款广受欢迎的开源跨平台视频编辑器的最新功能更新。 Shotcut 26.6 引入了对 OpenFX 插件和 VST2 音频插件的基本…
-
实时音视频技术在“一起看电影”场景中的应用和实现
异地的人同步看同一部电影、边看边聊,看似简单,工程上要同时解决两件难事:播放进度毫秒级对齐 + 实时语音/视频陪看。本文拆解两套同步方案并给出基于 ZEGO RTC 的示例代码。 …
-
从 1v1 速配到「1 主持 + 多嘉宾」相亲房,拆解视频相亲背后的实时音视频架构
从 1v1 速配到「1 主持 + 多嘉宾」相亲房,拆解视频相亲背后的实时音视频架构:低延迟连麦、美颜滤镜、礼物打赏、内容审核与弱网优化,并附基于 ZEGO SDK 的示例代码。 一…
-
从 0 到 1 拆解一个在线 pia 戏(语音配音戏)应用的 RTC 技术架构
从 0 到 1 拆解一个在线 pia 戏(语音配音戏)应用的技术架构:多人麦位、200ms 低延迟语音、BGM 混音、变声混响与房间信令,并给出可落地的基于 ZEGO RTC SD…
-
NDI协议是什么?NDI协议如何在直播中工作
本文涵盖广播公司需要了解的关于NDI协议的一切:它的技术原理、与其他流媒体协议的区别,以及如何在直播制作环境中实施。
-
Palabra.ai 推动企业通信实时语音翻译技术在全球范围内的发展
026 年 6 月 1 日,总部位于伦敦的 AI 语音翻译公司 Palabra.ai 在 Alexis Ohanian 的支持下,年度经常性收入 (ARR) 已超过 100 万美元…
-
RTSP 拒绝消亡,因为它依然运行良好
每隔几年,就会有人发表一篇”RTSP已死”的文章。他们会指出,这个协议诞生于1998年,无法在浏览器中运行,不能接入CDN,也不支持自适应码率。结论是:直接…
-
Telinta 和 Vida 联手为电信服务提供商引入 AI 代理
全球云端软交换解决方案提供商 Telinta 和 AI 代理操作系统 Vida Global Inc.(VIDA)已达成合作,旨在为使用 Telinta 托管软交换和计费平台的电信…