-
LLM-ForcedAligner:多语种长语音非自回归强制对齐器
LLM-ForcedAligner 具备平均时间偏移低、多语言和跨语言处理能力强、最长支持5分钟语音输入和灵活定义时间戳预测位置的特点,并且其非自回归推理方式可消除大语言模型next-token prediction范式中存在的幻觉和计算缓慢问题。
-
视频直播卡顿的原因(视频直播卡顿怎么解决)
视频直播卡顿是音视频开发者最为关注的问题之一。本文向开发者们介绍视频直播卡顿的主要原因,问题表现、常见场景、问题定位排查和解决方案,同时提供实际案例和预防措施,帮助开发者更好的解决…
-
视频生成推理加速实践:基于全局时间索引的序列并行 3D 位置编码优化
本文分享了哔哩哔哩在视频生成模型推理优化中的一系列实践,重点围绕分块自回归视频模型在序列并行场景下的计算与通信优化展开。除上述工作外,我们还在低比特量化、计算图优化等方向持续探索,…
-
Roku 2025 Q4 利润扭亏为盈8050万美元,平台流媒体播放时长提升至1456亿小时
Roku 于 2 月 12 日公布,截至 2025 年 12 月 31 日的第四季度,净利润为 8050 万美元,收入为 12.2 亿美元。相比之下,上年同期净亏损为 3550 万…
-
Google Docs 推出由 Gemini 提供支持的音频摘要功能
继 8 月份推出文本转语音功能后,Google Docs 现在又推出了音频摘要功能。 在网页上,转到“tools”>“Audio”,您会找到“收听此选项卡”,旁边还有一个新的“收听…
-
Voximplant 将 Cartesia Line 语音代理引入真实通话中
2026 年 2 月 12 日,云通信平台 Voximplant 宣布原生支持 Cartesia Line,这是一个用于构建 AI 代理的代码优先生态系统。 该集成使开发人员能够将…
-
NiCE 发布 Agentic AI 客户体验前沿报告
NiCE 于2月12日发布了最新报告《Agentic AI 客户体验前沿报告》。以下是报告的5个主要观点: 1. Agentic AI 是现在,而非未来 2025年上半年,关于 …
-
Amagi 2026 财年前 9 个月营收增长 30%
为全球媒体和娱乐公司提供 AI 解决方案的云原生 SaaS 平台 Amagi Media Labs 公布了其2026财年第三季度及截至2025年12月31日的九个月的财务业绩。 主…
-
Pitch International 与 Synamedia 和 Globecast 合作,启动基于云端的足总杯赛事分发服务
Pitch International 与 Globecast 和 Synamedia 合作,提供基于云的足总杯赛事分发服务。 此次合作使拥有该赛事在西欧、中东和北非地区转播权的 …
-
AMD 视频解码现已统一于 RadeonSI 和 RADV Vulkan 视频之间
今天合并到 Mesa 26.1-devel 版本的是 RadeonSI Gallium3D 和 RADV Vulkan 驱动程序之间 AMD 视频解码实现的统一。 传统上,AMD …
-
小红书发布FireRed-Image-Edit:图像编辑新SOTA
昨日,小红书基础模型 FireRed-Image-Edit 正式亮相 GitHub。 作为小红书 Super Intelligence Team 在图像生成与编辑领域的一次重要探索…
-
大规模 RTSP 流媒体传输:架构和性能考量
尽管流媒体行业常聚焦于最新协议或 Flash 等已淘汰的旧标准,实时流媒体协议(RTSP)却正迎来巨大复兴。这并非因 RTSP 是突破性新技术,而是它始终是交通运输部门、执法机构及…
-
ZEGO AI Agent 如何设置智能体语音情绪?让 AI 语音互动更具情感表现力
目前部分大模型版本文字转语音(TTS),支持指定合成时所使用的情绪。 在与 AI 进行实时语音互动场景下,可以搭配大语言模型 LLM 的系统提示词,实现让 AI 基于人设输出对应的…
-
vivo:游戏中心弱网优化实践
本实践围绕游戏中心在弱网环境下的性能优化展开,针对复杂网络场景下的页面加载慢、资源加载失败等问题,提出了优化方案:接入支持 QUIC 协议的 Cronet 网络库,通过更快的连接建…
-
Swipey AI 推出专注于个性化数字互动的交互式 AI 伴侣平台
Swipey AI 宣布推出其交互式 AI 驱动的伴侣平台,引入对话式体验,旨在优先考虑个性化、用户控制和沉浸式数字交互。 与严重依赖静态或预设内容的传统数字娱乐平台不同,Swip…
-
Haivision 成为美国职业棒球小联盟官方视频编码器
美国职业棒球小联盟(MiLB)正式选定 Haivision Systems 的Makito X4视频编码器作为联盟官方设备。 Haivision 表示,这项新技术合作将使编码器支持…
-
分析:东南亚高端视频点播业务加速增长
据 Media Partners Asia (MPA) 及其专有测量平台 AMPD 称,东南亚高端视频点播市场在 2025 年实现了强劲增长,用户增长大幅反弹,联网电视 (CTV)…
-
远程办公沟通面临的5个挑战及应对方法
沟通是远程和混合办公成功的关键。但同时,它也日益成为企业IT团队运营风险的来源。许多组织已经部署统一通信系统以更好地支持分布式办公团队。然而,技术、治理和使用一致性方面的差距可能会…
-
Zoom 推出个人笔记工具:My notes
Zoom推出了“ My notes(我的笔记)”和“个人工作流程(Personal workflows)”功能。 “我的笔记”功能现已上线;“个人工作流程”功能目前处于测试阶段,将…
-
DAZN 移动应用新增与球员实时聊天功能
DAZN 在其移动应用程序中推出了一项新的互动功能,注册用户可以与足球运动员进行实时聊天,该功能采用人工智能翻译,旨在支持多语言参与。 首批确认参与直播的球员包括巴塞罗那的亚历杭…