-
VoiceLine 融资 1000 万欧元,用于扩展面向一线团队的企业语音人工智能
VoiceLine 已完成 A 轮融资,旨在扩展其面向一线团队的语音优先 AI 平台,以实现现场工作流程自动化、提高实时可见性,并支持企业客户的国际增长。
-
WebRTC技术栈指南:可扩展实时应用程序的架构
与具有简单请求-响应模式的传统 Web 应用程序不同,实时通信平台需要一个统一的生态系统和复杂的 WebRTC 技术栈来处理实时媒体流、管理对等连接、确保低延迟,并能够扩展到大量并…
-
8×8 Smart Assist 帮助联络中心更快地解决问题,提供更一致的客户体验
使用实时人工智能引导工作流程的联络中心能够更快地解决问题,减少通话后的工作量,并提供更一致的客户体验。 为了帮助企业大规模实现这些目标,全球商业通信平台提供商 8×8 公司(纳斯达…
-
Ookla和爱立信共同开发了用于测试5G网络切片的方法
连接智能专家 Ookla 和通信技术巨头爱立信联合展示了一项解决方案,使用户能够测量和验证 5G 网络切片的性能。两家公司表示,此次合作标志着 5G-Advanced 时代的一个里…
-
音视频技术已大幅提升,为何我们仍感受不到身临其境?
过去20年来,我们一直在以易于衡量的方式改进数字媒体。分辨率稳步提升,网络速度加快,延迟降低。几乎所有技术指标都取得了显著进步。然而,尽管取得了如此巨大的进步,我们的数字互动仍然感…
-
2026 年 FAST 趋势报告:哪些方面正在流行?
有一点很明确:免费广告支持型流媒体电视(FAST)不再是行业的颠覆者,而是新的常态。展望2026年,FAST将继续重新定义受众消费媒体的方式、广告商与观众互动的方式以及内容所有者大…
-
OpenAI 的 WebSocket 模式如何重塑低延迟语音驱动 AI 体验
在生成式 AI 领域,延迟是沉浸感的终极杀手。直到最近,构建语音驱动的 AI 代理仍如同组装鲁布·戈德堡装置:需将音频输入语音转文本(STT)模型,将转录文本发送至大语言模型(LL…
-
Genesys 将推出欧盟主权云
联络中心平台提供商 Genesys 昨日宣布,其Genesys Cloud 平台将上线AWS 欧洲主权云 (AWS-ESC)。Genesys Cloud 欧洲主权区域将于今年 5 …
-
Omdia表示,微剧在美国移动端用户参与度方面已超越流媒体
据 Omdia 称,微剧正在成为在线视频领域增长最快的格式之一,美国用户现在每天在移动应用上观看微剧的时间比在移动设备上观看 Netflix、Disney+ 或 Amazon Pr…
-
ollama 0.17 版本发布,改进了 OpenClaw 入门流程
开源项目 ollama 发布了新版本,该项目旨在帮助用户在 Windows、macOS 和 Linux 系统下轻松部署各种 LLM(生命周期管理)系统。此次 ollama v0.1…
-
FFmpeg 获得实验性 xHE-AAC MPS212 解码支持
FFmpeg 开发者 Lynne 近期最广为人知的贡献是为该开源多媒体库完成的 Vulkan 视频支持工作,而近日合并至 FFmpeg 的另一项重大贡献则超出了该范畴:新增了对xH…
-
英特尔发布 OpenVINO 2026,改进了 NPU 处理能力,并扩展了对 LLM 的支持
英特尔开源人工智能工具包 OpenVINO 发布了 2026 年的首个主要版本。此次发布的 OpenVINO 2026.0 扩展了对大型语言模型 (LLM) 的支持,改进了对英特尔…
-
LLM-ForcedAligner:多语种长语音非自回归强制对齐器
LLM-ForcedAligner 具备平均时间偏移低、多语言和跨语言处理能力强、最长支持5分钟语音输入和灵活定义时间戳预测位置的特点,并且其非自回归推理方式可消除大语言模型next-token prediction范式中存在的幻觉和计算缓慢问题。
-
视频直播卡顿的原因(视频直播卡顿怎么解决)
视频直播卡顿是音视频开发者最为关注的问题之一。本文向开发者们介绍视频直播卡顿的主要原因,问题表现、常见场景、问题定位排查和解决方案,同时提供实际案例和预防措施,帮助开发者更好的解决…
-
视频生成推理加速实践:基于全局时间索引的序列并行 3D 位置编码优化
本文分享了哔哩哔哩在视频生成模型推理优化中的一系列实践,重点围绕分块自回归视频模型在序列并行场景下的计算与通信优化展开。除上述工作外,我们还在低比特量化、计算图优化等方向持续探索,…
-
Roku 2025 Q4 利润扭亏为盈8050万美元,平台流媒体播放时长提升至1456亿小时
Roku 于 2 月 12 日公布,截至 2025 年 12 月 31 日的第四季度,净利润为 8050 万美元,收入为 12.2 亿美元。相比之下,上年同期净亏损为 3550 万…
-
Google Docs 推出由 Gemini 提供支持的音频摘要功能
继 8 月份推出文本转语音功能后,Google Docs 现在又推出了音频摘要功能。 在网页上,转到“tools”>“Audio”,您会找到“收听此选项卡”,旁边还有一个新的“收听…
-
Voximplant 将 Cartesia Line 语音代理引入真实通话中
2026 年 2 月 12 日,云通信平台 Voximplant 宣布原生支持 Cartesia Line,这是一个用于构建 AI 代理的代码优先生态系统。 该集成使开发人员能够将…
-
NiCE 发布 Agentic AI 客户体验前沿报告
NiCE 于2月12日发布了最新报告《Agentic AI 客户体验前沿报告》。以下是报告的5个主要观点: 1. Agentic AI 是现在,而非未来 2025年上半年,关于 …
-
Amagi 2026 财年前 9 个月营收增长 30%
为全球媒体和娱乐公司提供 AI 解决方案的云原生 SaaS 平台 Amagi Media Labs 公布了其2026财年第三季度及截至2025年12月31日的九个月的财务业绩。 主…