Hume AI 准备推出 Octave 2 多语言文本转语音模型

Hume AI 正在内部测试 Octave 2 Multilingual,这是一种文本转语音模型,具有跨 10 多种语言的低延迟语音合成功能,可实现实时音频。

Hume AI 准备推出 Octave 2 多语言文本转语音模型

Hume AI 正准备推出 Octave 2 Multilingual,这是其文本转语音产品线继早期 Octave 模型发布之后的又一力作。Octave 2 支持超过 10 种语言,远远超出了早期模型专注于富有情感表达的英语语音的范畴。其描述提到,Octave 2 能够提供富有表现力、自然且低延迟的语音,非常适合需要快速实时语音生成的用例,例如实时翻译、语音机器人和对话界面。

新模型旨在惠及广泛的用户,从开发多语言应用程序和实时翻译工具的开发者,到制作多语言播客或有声读物的创作者。其关键进步之一是能够在不同语言之间切换,并输出听起来令人信服的人类语音,即使是像俄语这样语音独特的语言也是如此。

据报道,在早期的并排比较中,Octave 2 产生的音频比其前代产品更自然,难以与真人说话者区分开来,这对于任何人工智能语音系统来说都是值得注意的。

Octave 2 多语言模型尚未公开发布,但已在早期内部和隐藏测试中浮现,表明即将正式发布。这符合 Hume AI 更广泛的产品方向,即专注于情感丰富且具备情境感知能力的 AI 语音。如果 Octave 2 的快速响应时间和语言灵活性能够持续保持规模化,它将很快吸引商业和研究领域的关注,尤其是在对处理实时多语言音频的工具需求不断增长的背景下。其新功能的发现源于测试和对生成输出差异的观察,Hume AI 尚未发布公开文档或公告。

随着推出的临近,开发人员和早期采用者应该密切关注进一步的更新和公开演示。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/61982.html

(0)

发表回复

登录后才能评论