2026年5月12日,ZEGO 实时互动 AI Agent 2.12 版本发布,新增多家 ASR 厂商和模型、新加坡节点和Round 机制等功能。

新增多家 ASR 厂商和模型
新增火山大模型 ASR、阿里云百炼千问 ASR、阿里云百炼 Fun-ASR。可以通过 ASR Vendor 支持 Tencent、AliyunParaformer、AliyunGummy、ByteDance 等厂商配置。
适用于中文方言识别、多语种识别场景。具体包括:
- 腾讯 ASR:大模型版本,包括中英粤+9种方言大模型引擎【大模型版】、普方英大模型引擎【大模型版】等。详情查看腾讯云-实时语音识别。
- 阿里云百炼 Fun-ASR 系列模型:主要支持中文及方言。详情查看实时语音识别-Fun-ASR/Gummy/Paraformer。
- 阿里云百炼千问系列模型:主要适用于中文、英文等多种语言。详情查看实时语音识别-千问。
- 火山大模型流式语音识别模型:适用于中英等语种场景。详情查看火山语音识别大模型。
详情配置方式请参考文档 配置 ASR。
新增新加坡节点
新增新加坡集群,默认配置新加坡节点 ASR、LLM、TTS、数字人 等服务。
适用于海外客户降低延迟、多区域部署、隐私合规相关需求场景。
新加坡节点开通及定价请联系ZEGO商务。
新增 Round 机制
新增 Round 机制,明确 AI 某一轮对话结束时机。Round 是 AI Agent 交互链路的唯一标识符,服务端为每次交互生成升序序号,不会重复。每次用户说话或 API 调用生成一个 Round 值,后续所有回调(ASR、LLM、TTS、状态变化、打断)都携带 Round,业务方可准确追踪完整对话链路。
适用于 AI 陪聊、语聊房、数字人、智能客服等需要追踪完整对话链路的场景,尤其适合处理打断、排队等复杂情况。
配置方式请参考文档:Round 机制与回调追踪
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/66666.html