Verbit 推出用于 ASR 直播字幕的说话人识别技术

海外观察 • 2025年6月16日上午10:38 • 行业资讯

AI 语音转录和字幕平台 Verbit 更新了其 Captivate ASR 解决方案，使其能够识别自动字幕中的特定特征。

据该公司称，该识别功能使观众能够看到清晰识别说话者的字幕和字幕，而不是传统上用于指示说话者转换的通用楔形（>>）或破折号。

例如 >> JONATHAN WILLIAMS：让我们来看看今天的一些热门新闻。

该公司的全球准备团队会在节目播出前捕捉指定发言者（例如主持人、记者或体育解说员）的语音特征，即“语音签名”。Verbit 表示，这些签名会被标记，添加到其经过训练的声学和语言模型中，并在直播过程中激活，从而准确清晰地实时标记发言者。

扬声器 ID 功能适用于新闻、天气和体育直播。

Verbit 总经理 Doug Karlovits 表示：“实时 ASR 字幕观众应该享受到与人工字幕长期以来提供的同等清晰度和语境。我们全新的说话人识别解决方案利用最先进、最具创新性的说话人模型，远超传统的 ASR 输出，实现了最高的说话人识别准确率。”

“我们与客户合作，确定他们想要识别的说话者，”Karlovits 补充道。“与我们所有的服务一样，我们提供一系列定制的说话者身份识别选项，并可根据客户的具体要求和偏好定制格式和样式。”

本文来自作者投稿，版权归原作者所有。如需转载，请注明出处：https://www.nxrte.com/zixun/58863.html