AI 语音转录和字幕平台 Verbit 更新了其 Captivate ASR 解决方案,使其能够识别自动字幕中的特定特征。

据该公司称,该识别功能使观众能够看到清晰识别说话者的字幕和字幕,而不是传统上用于指示说话者转换的通用楔形(>>)或破折号。
例如 >> JONATHAN WILLIAMS:让我们来看看今天的一些热门新闻。
该公司的全球准备团队会在节目播出前捕捉指定发言者(例如主持人、记者或体育解说员)的语音特征,即“语音签名”。Verbit 表示,这些签名会被标记,添加到其经过训练的声学和语言模型中,并在直播过程中激活,从而准确清晰地实时标记发言者。
扬声器 ID 功能适用于新闻、天气和体育直播。
Verbit 总经理 Doug Karlovits 表示:“实时 ASR 字幕观众应该享受到与人工字幕长期以来提供的同等清晰度和语境。我们全新的说话人识别解决方案利用最先进、最具创新性的说话人模型,远超传统的 ASR 输出,实现了最高的说话人识别准确率。”
“我们与客户合作,确定他们想要识别的说话者,”Karlovits 补充道。“与我们所有的服务一样,我们提供一系列定制的说话者身份识别选项,并可根据客户的具体要求和偏好定制格式和样式。”
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/58863.html