Deepdub 推出 Lightning 2.5:一款实时 AI 语音模型,支持可扩展的生产级语音应用程序

以色列语音 AI 初创公司 Deepdub 推出了 Lightning 2.5,这是一款实时基础语音模型,旨在支持可扩展的生产级语音应用程序。新版本在性能和效率方面实现了显著提升,使其适用于联络中心、AI 代理和实时配音等实时交互系统。

Deepdub 推出 Lightning 2.5:一款实时 AI 语音模型,支持可扩展的生产级语音应用程序

性能和效率

Lightning 2.5 的吞吐量较上一代提升了2.8 倍,计算资源利用率也提升了 5 倍。其延迟低至200 毫秒,比行业标准快了约半秒,在实时对话 AI、实时画外音和事件驱动 AI 流程等用例中实现了真正的实时性能。

该模型针对 NVIDIA GPU 加速环境进行了优化,确保在不影响质量的情况下实现大规模部署。通过利用并行推理管道,Deepdub 将 Lightning 2.5 定位为针对延迟敏感场景的高性能解决方案。

实时应用程序

Lightning 2.5 立足于语音为核心的用户体验核心场景。部署应用包括:

  • 需要无缝多语言对话的客户支持平台。
  • 提供自然、实时交互的人工智能代理和虚拟助手。
  • 通过多种语言的即时配音实现媒体本地化。
  • 游戏和娱乐语音聊天需要富有表现力和自然的语音输出。

Deepdub 团队在一份公关新闻稿中强调,Lightning 在跨多种语言扩展的同时,还能保持语音保真度、自然韵律和情感细微差别,这对大多数实时 TTS(文本转语音)系统来说都是一个挑战。

Deepdub 首席执行官兼联合创始人 Ofir Krakowski 表示:“Lightning 代表着实时、富有表现力的语音生成技术的一次飞跃。无论是支持多语言 AI ​​代理、沉浸式内容平台,还是大规模语音优先自动化,Lightning 都能以客户所需的速度、保真度和质量,将基础语音 AI 带入生产环境。”

关于 Deepdub

Deepdub 是人工智能语音解决方案提供商,为电视、电影、广告、游戏和在线学习行业的全球企业提供高质量的本地化服务。公司拥有一支由技术、配音和语言专家组成的国际团队,提供端到端语音解决方案,以超过 130 种语言和方言保留原创内容的情感和文化完整性。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/61548.html

(0)

相关推荐

发表回复

登录后才能评论