aiOla推出QUASAR,一个用于高度个性化语音识别路由的网关

2026年2月9日,致力于推进语音识别技术和语音代理的语音 AI 公司 aiOla 推出了 QUASAR(质量加权无监督 ASR 评估和排名),这是一个语音智能网关,通过将每个音频请求动态路由到最有可能在特定时刻表现最佳的 ASR 引擎,实现更一致、更可靠的自动语音识别 (ASR)。

aiOla推出QUASAR,一个用于高度个性化语音识别路由的网关

QUASAR 采用定制化方案,使组织能够根据说话人特征、音频条件和领域上下文实时调整转录决策。QUASAR 充当智能网关,评估每个传入的音频请求,并将其路由到最有可能在该特定上下文中提供最高质量转录的 ASR 选项。该平台支持跨多个 ASR 源进行协调,包括商业云 API、自托管引擎和自定义部署,而无需企业长期绑定单一供应商。

aiOla联合创始人兼总裁Amir Haramaty在一份声明中表示:“迄今为止,企业只能选择一种自动语音识别(ASR)引擎,并接受其固有的缺陷。QUASAR改变了这一现状,它将语音识别视为一个动态问题,最佳方案会根据实际情况而非平均值在每次交互中发生变化。这对整个行业来说是一次重大飞跃,并有可能彻底颠覆ASR的使用方式。”

在包含清晰语音、专业演讲、各种口音、机构音频和领域密集型金融内容的六个不同基准数据集的内部评估中,QUASAR 在选择最佳自动语音识别 (ASR) 选项方面达到了 88.8% 的总体准确率,或在结果相当的情况下选择同等最佳选项。在清晰语音上,准确率高达 97%,而在包含口音、噪声和专业词汇等更具挑战性的音频上,准确率保持在 79% 到 88% 之间。

“语音正逐渐成为技术的主要交互界面之一,这种转变要求我们从根本上重新思考语音识别的工作原理,”Haramaty说道。“我们正在进入语音 AI 的新时代,在这个时代,自动语音识别(ASR)必须作为一种动态基础设施运行,而不是一种静态的模型选择。QUASAR通过大规模部署语音识别,将这一愿景变为现实,提高了不同人群和环境下的识别一致性,加快了向新地区和垂直领域的扩展,并在不依赖特定供应商的情况下实现了更智能的成本效益权衡。最终,QUASAR打造了一个能够变革整个语音生态系统的平台,从构建字幕工具的个人开发者到每年处理数十亿分钟音频的全球呼叫中心,都将从中受益。”

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/64736.html

(0)

相关推荐

发表回复

登录后才能评论