Hume AI 准备推出 Octave 2 多语言文本转语音模型

AIGC • 2025年9月30日上午11:12 • 行业资讯

Hume AI 正在内部测试 Octave 2 Multilingual，这是一种文本转语音模型，具有跨 10 多种语言的低延迟语音合成功能，可实现实时音频。

Hume AI 正准备推出 Octave 2 Multilingual，这是其文本转语音产品线继早期 Octave 模型发布之后的又一力作。Octave 2 支持超过 10 种语言，远远超出了早期模型专注于富有情感表达的英语语音的范畴。其描述提到，Octave 2 能够提供富有表现力、自然且低延迟的语音，非常适合需要快速实时语音生成的用例，例如实时翻译、语音机器人和对话界面。

新模型旨在惠及广泛的用户，从开发多语言应用程序和实时翻译工具的开发者，到制作多语言播客或有声读物的创作者。其关键进步之一是能够在不同语言之间切换，并输出听起来令人信服的人类语音，即使是像俄语这样语音独特的语言也是如此。

据报道，在早期的并排比较中，Octave 2 产生的音频比其前代产品更自然，难以与真人说话者区分开来，这对于任何人工智能语音系统来说都是值得注意的。

Octave 2 多语言模型尚未公开发布，但已在早期内部和隐藏测试中浮现，表明即将正式发布。这符合 Hume AI 更广泛的产品方向，即专注于情感丰富且具备情境感知能力的 AI 语音。如果 Octave 2 的快速响应时间和语言灵活性能够持续保持规模化，它将很快吸引商业和研究领域的关注，尤其是在对处理实时多语言音频的工具需求不断增长的背景下。其新功能的发现源于测试和对生成输出差异的观察，Hume AI 尚未发布公开文档或公告。

随着推出的临近，开发人员和早期采用者应该密切关注进一步的更新和公开演示。

本文来自作者投稿，版权归原作者所有。如需转载，请注明出处：https://www.nxrte.com/zixun/61982.html