NeuralGarage通过VisualDub革新了媒体中的多语言唇语同步：生成式AI的突破

2023年6月7日，来自班加罗尔的深度技术初创公司 NeuralGarage 凭借其专有技术 VisualDub 成功地在生成性人工智能领域取得了新的突破，该技术有助于媒体中的多语言唇语同步。印度的广告片和其他营销内容通常是用印地语制作和拍摄的，然后再配音成几种不同的语言，这使得它们在地区观众看来不真实。NeuralGarage 的技术通过利用其先进的人工智能能力，将演员的下巴和嘴唇与配音的音频同步，帮助使这些内容成为当地消费者的本土内容。这项技术与人脸和语言无关。

NeuralGarage 团队最近与亚马逊印度公司合作，在电视和数字平台上投放了他们的广告活动。此次合作代表了全球首个集成生成人工智能技术、彻底改变内容创作和最后一英里消费者体验的用例。它有望成为人工智能在媒体和广告中使用的突破性发展，可以加速此类技术在整个行业的整合。

使用 VisualDub 通过生成逼真的视觉-听觉线索来减少媒体中的视觉不和谐，为全球类似应用打开了大门。在一个拥有超过 22 种主要语言的国家，迫切需要对数字平台、OTT 或广播网络上的内容进行个性化处理。NeuralGarage 希望在实现这一目标方面发挥重要作用。

随着文化敏感性越来越受到关注，一个拥有如此丰富的文化遗产和多样化语言的国家，各个地区都有其独特的语言或口音，生成人工智能无疑为广告商、内容创作者和电影制作人带来了将嘴唇动作与对话同步的承诺，使整个音频对观众来说更加真实。这个故事也可能在世界各地以类似方式上演。

NeuralGarage 的联合创始人兼首席执行官 Mandar Natekar说：“我们很高兴展示 VisualDub 的能力，以展示 Gen AI 的创造性应用。我们公司的愿景一直是利用生成式人工智能的真正潜力。随着人工智能用例在全球范围内重新引起人们的兴趣和关注，我们将继续致力于促进这一领域的创新。”

随着 AI 聊天机器人、工具和软件主导全球新闻周期，关于谁能提出下一个革命性创新的竞争正在升温。对于生成式 AI 初创公司来说，这样的成功故事很可能会对类似公司起到启发作用。

NeuralGarage 的联合创始人兼首席技术官 Subhabrata Debnath表示：“VisualDub 背后的目标是尽量减少内容和媒体中的视觉不协调。我们致力于不断创新，突破生成式 AI 的界限，并将其触及范围扩展到各个行业。我们坚信，我们的工作将允许无缝创建多语言口型同步内容，从而在内容创建者和最终消费者之间建立更牢固、更紧密的联系。” 随着 AI 准备主宰大多数细分市场和行业，NeuralGarage 处于有利地位，可以积极保持其在技术开发方面的势头，并提升 VisualDub 以彻底改变内容创建和最后一英里的消费者体验。

关于NeuralGarage

NeuralGarage 是一家位于印度班加罗尔的深度科技创业公司，专注于生成人工智能技术。它由 IIT Kanpur 校友和媒体和娱乐行业的高级领导创立，处于 AI 技术和创新的最前沿。它的愿景是让全球通信在语言、内容和媒体之间无缝衔接。在机构风险投资基金 Exfinity Ventures 的支持下，NeuralGarage 迄今已在种子轮融资中筹集了 145 万美元。它得到了像 Amit Patni 这样的天使投资人的支持。

本文为原创稿件，版权归作者所有，如需转载，请注明出处：https://www.nxrte.com/zixun/26603.html