OpenAI 发布语音引擎“Voice Engine”来创建人类声音

追风者 • 2024年3月30日上午10:46 • 行业资讯

OpenAI 现在可以利用其 “语音引擎 “(Voice Engine)平台重现人类的声音。由于明显的道德和法律问题，这家由微软投资的公司对新的人工智能引擎一直守口如瓶。

在 ChatGPT、DALL-E 和 Sora 大获成功之后，OpenAI 现在又开始涉足声音领域，尤其是人类的语言和声音。语音引擎人工智能目前正处于测试阶段，但互联网用户可能无法注册订阅。

语音引擎只需 15 秒录音就能重现多语言人声

ChatGPT 风靡全球，DALL-E 释放了数百万人的创造力，而 Sora 也许很快就能让普通网民成为电影创作者。继文字、图像和视频之后，OpenAI 现在又发布了语音引擎，这是一个可以再现人类声音的人工智能平台。

纽约时报收到了语音引擎平台的演示。据报道，该人工智能引擎可以通过 15 秒的录音重现人类的声音。如果这还不够吓人，在吸收了所需信息后，Voice Engine 还能用重现的人类声音说出任何文字提示。

令人惊讶的是，文本提示甚至不需要使用说话者的母语，因为说话者的声音是用来训练人工智能引擎的。换句话说，一个以英语为母语的人可以通过语音引擎用西班牙语、法语、中文或许多其他语言说话。

鉴于这种技术存在明显的隐患，OpenAI 保证正在探索多种安全检查方法，如水印。此外，还有一些控制措施可以限制语音引擎模仿某些人的声音。

有趣的是，据报道，OpenAI 产品经理 Jeff Harris 声称，该公司目前并没有从这项技术中赚钱的计划。他补充说，这项技术的主要目的是为那些因疾病或事故而失声的人提供帮助。

OpenAI 的 Sora 可让用户仅凭文字提示就能创建 60 秒的动态图片，但它并不向公众开放。同样，该公司也没有发布任何版本的语音引擎。

语音引擎目前只对 “一小部分企业 “开放。简而言之，少数几家公司（可能是通过邀请）可以有限地访问该平台。

毋庸置疑，一个人工智能平台可以根据 15 段录音，用多种语言重现人类的声音，这在道德和法律上都有巨大的影响。

OpenAI 可能限制了对语音引擎的访问。然而，令人担忧的是，人工智能已经蜕变成一个庞然大物。

除了令人信服的深度伪造图像和视频外，诈骗犯和欺诈者利用人工智能模仿人类声音已经有一段时间了。有几名受害者就是因为听起来像是他们的亲戚遇到了麻烦并在向他们要钱的深度虚假语音信息而上当受骗的。

如果落入坏人之手，”语音引擎 “可以接受并再现政客、名人、记者和其他知名人士的声音。该平台可用于创建令人信服的音频片段，传播错误信息或进行宣传。同样可怕的是，黑客和犯罪分子可能会破坏依赖语音验证的安全系统。

因此，OpenAI 很可能会对语音引擎平台进行严格审查和监管。它必须制定一些严格的智能数字锁和严格的安全检查，以防止其被滥用。

撇开安全和道德问题不谈，OpenAI 的语音引擎对于需要将自己的作品配音成其他语言的电影和网络剧制作者来说可能大有裨益。同样，教育和娱乐领域也会受益匪浅。

本文来自作者投稿，版权归原作者所有。如需转载，请注明出处：https://www.nxrte.com/zixun/46296.html