实时语音 AI 技术服务商 Krisp 宣布推出语音翻译v3,这是其企业级语音翻译解决方案的重大版本,并同时推出语音翻译 API。该引擎曾在医疗机构的实际部署中实现了96%的准确率,现在开发者可以通过自助式 API 使用该引擎。

对于大规模运行翻译通话的企业和业务流程外包 (BPO) 服务而言,准确翻译从来都不是唯一的挑战。运营负责人需要了解每次通话的翻译是否有效,而不仅仅是抽样调查。质量团队需要证据证明姓名、号码和受监管的内容在翻译过程中得以保留。在联络中心之外开发语音产品的开发人员也面临着类似的难题。他们的用户使用多种语言,但大多数翻译工具在处理嘈杂的音频、带有口音的语音和特定领域的术语时都会失效。Voice Translation v3 弥补了这两个方面的不足。
对于联络中心和业务流程外包 (BPO) 而言,语音翻译 v3 增加了控制和可视性,使多语言操作可衡量。
Krisp 首席执行官兼联合创始人 Davit Baghdasaryan 表示:“实时语音翻译正处于蓬勃发展的时期,但目前市面上大多数产品都是基于通用数据构建的,并未在准确性至关重要的场景下进行测试。我们打造的引擎专为最严苛的环境而设计:医疗、保险和金融服务等行业的实时通话,在这些场景中,任何一个词的出错都可能造成严重后果。正是这一点,使得翻译从一项功能发展成为一项运营基础设施。如今,该引擎既可以作为托管产品提供给企业,也可以作为自助式 API 提供给开发者。”
新增功能:企业运营控制
语音翻译 v3 增加了控制和可视化功能,使多语言操作可衡量:
- 准确性质量保证:自动对 100% 的翻译通话进行四项质量维度的准确性评分。
- 速记短语:预先编写、规范化的内容,以任何语言的翻译语音形式呈现。
- 实时通话审核:管理员可以从客户和客服人员的角度收听通话,并实时访问双语实时转录文本。
- 语言自动选择:通话开始时自动选择正确的语言,无需手动设置。
- 自定义词汇表和词典:自定义引擎识别和翻译行业术语的方式。
- 任意两两组合均可包含 61 种语言:包括美国西班牙语、加拿大法语、埃及阿拉伯语以及更多地区变体。
对于开发者而言,语音翻译 API 拥有相同的引擎、相同的准确度和相同的 61 种语言。
同样的引擎,现在可供开发者自助使用:
- 同样的引擎,自助服务:注册、领取钥匙、发货。无需销售电话。
- 一个 WebSocket:语音输入,翻译后的语音和文本输出。
- SDK:发布时将支持 JavaScript 和 Python,C++ 即将推出。
- 从一开始就拥有领域控制权:内置自定义词汇表和词典。
- 99.9% 正常运行时间 SLA:与企业版产品相同。
- 免费试用 60 分钟:先测试后再扩大规模。
Krisp授权与合作执行副总裁Robert Schoenfield表示:“对于开发远程医疗、客户支持、金融科技和其他对准确性要求极高的产品的开发者来说,仅仅提供一个能在干净音频环境下运行的演示版本是不够的。他们需要的是一个已经在真实、高风险通话中经过测试的引擎。语音翻译API让他们可以直接访问这个引擎,而且开发者无需联系销售人员即可上手使用。”
语音翻译 v3 基于实际部署的生产成果。在医疗保健领域的实际部署中,该引擎无需人工翻译即可完成 90% 的多语言通话,整体翻译准确率达到 96%,并且在 8 种以上语言中未发生任何患者安全或体验事故。在涵盖 30 种语言和 6 个业务领域的基准测试中,AutoQA 得分始终保持在 93 到 97 分之间,并经双语语言专家独立审核确认。
语音翻译 v3 现已面向企业呼叫中心和业务流程外包 (BPO) 客户推出。语音翻译 API 现已可通过Krisp 开发者控制面板获取,提供 60 分钟免费翻译时长,并支持自助订阅定价。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/67577.html