以色列语音 AI 初创公司 Deepdub 推出了 Lightning 2.5,这是一款实时基础语音模型,旨在支持可扩展的生产级语音应用程序。新版本在性能和效率方面实现了显著提升,使其适用于联络中心、AI 代理和实时配音等实时交互系统。

性能和效率
Lightning 2.5 的吞吐量较上一代提升了2.8 倍,计算资源利用率也提升了 5 倍。其延迟低至200 毫秒,比行业标准快了约半秒,在实时对话 AI、实时画外音和事件驱动 AI 流程等用例中实现了真正的实时性能。
该模型针对 NVIDIA GPU 加速环境进行了优化,确保在不影响质量的情况下实现大规模部署。通过利用并行推理管道,Deepdub 将 Lightning 2.5 定位为针对延迟敏感场景的高性能解决方案。
实时应用程序
Lightning 2.5 立足于语音为核心的用户体验核心场景。部署应用包括:
- 需要无缝多语言对话的客户支持平台。
- 提供自然、实时交互的人工智能代理和虚拟助手。
- 通过多种语言的即时配音实现媒体本地化。
- 游戏和娱乐语音聊天需要富有表现力和自然的语音输出。
Deepdub 团队在一份公关新闻稿中强调,Lightning 在跨多种语言扩展的同时,还能保持语音保真度、自然韵律和情感细微差别,这对大多数实时 TTS(文本转语音)系统来说都是一个挑战。
Deepdub 首席执行官兼联合创始人 Ofir Krakowski 表示:“Lightning 代表着实时、富有表现力的语音生成技术的一次飞跃。无论是支持多语言 AI 代理、沉浸式内容平台,还是大规模语音优先自动化,Lightning 都能以客户所需的速度、保真度和质量,将基础语音 AI 带入生产环境。”
关于 Deepdub
Deepdub 是人工智能语音解决方案提供商,为电视、电影、广告、游戏和在线学习行业的全球企业提供高质量的本地化服务。公司拥有一支由技术、配音和语言专家组成的国际团队,提供端到端语音解决方案,以超过 130 种语言和方言保留原创内容的情感和文化完整性。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/61548.html