AudioShake:基于人工智能的音频分离技术完成 1400 万美元 A 轮融资

AudioShake 近期宣布完成 1400 万美元 A 轮融资。本轮融资由 Shine Capital 领投,Thomson Reuters Ventures、Origin Ventures、Background Capital 以及现有投资者 Indicator Ventures 和 Precursor Ventures 也参与了跟投。

AudioShake:基于人工智能的音频分离技术完成 1400 万美元 A 轮融资

AudioShake 的核心创新在于其能够利用人工智能将音频记录分解成各个组成部分。传统上,音频受到一定限制,类似于“只读”格式;虽然用户可以收听,但缺乏轻松操控其元素的工具。AudioShake 改变了这一现状。其先进的技术使用户可以捕捉任何形式的音频,无论是电影配乐、播客、体育广播,甚至是简单的电话通话。并将其拆分成不同的音轨,通过语音、音乐和音效进行区分。音质始终保持专业水准,首次实现了所有音频内容的可编辑、可搜索和可编程。

许多现有技术都尝试提供音频分离功能;然而,AudioShake 的与众不同之处在于,它能够处理任何现有的音频录音,无论其来源如何。这不仅包括当代录音,还包括几十年前的内容,以及从现实世界中捕捉到的、最初并非为分离功能而设计的音频。最终,通过简单的 API 即可获得广播级质量的输出。

在过去的一年里,AudioShake 取得了显著的增长,在媒体和人工智能领域签订了 40 多个企业合同。这一成功使其收入同比增长近 400%,音频处理量超过 1 亿分钟。该公司的商业模式结合了年度订阅费和按使用量计费,其知名客户包括环球音乐、迪士尼音乐集团、华纳音乐集团、华纳兄弟探索频道、BET、NFL Films 等行业领军企业,以及其他几家著名的“Mag 7”公司。

AudioShake 技术的应用范围广泛,涵盖多个行业。例如,BMG 和 Reservoir Media 等唱片公司利用该软件分离 Nina Simone 和 De La Soul 等知名艺人专辑中的人声和乐器,使这些作品能够以沉浸式音频格式呈现。此外,Deluxe 等电影和后期制作工作室正在利用 AudioShake 分离对话、音乐和音效,以便编辑和制作外语配音。广播电台、新闻编辑室和播客平台受益于这项技术,可以消除不必要的背景噪音并分离重叠的扬声器。体育联盟和组织也在利用这项技术从视频片段中删除未经授权的音乐,从而避免潜在的版权侵权。

除了娱乐行业,AI 公司也纷纷选择 AudioShake 来创建庞大的结构化音频数据训练数据集。通过将混合音频源分离成各个组件,这些公司可以更好地准备音频数据,用于多模态 AI 训练。AudioShake 目前与多家领先的“Mag 7”科技公司和 AI 模型实验室合作,处理数百万小时的授权音频内容,以支持下一代 AI 模型。

利用这笔新资金,AudioShake 计划加速产品开发,扩大招聘规模,并强化市场推广策略。这包括扩大 AudioShake API 的访问权限,并为希望使用该技术的开发者和企业推出实时 SDK。

AudioShake 由谷歌前副总裁 Jessica Powell 和 Plaid 前数据科学主管 Luke Miner 于 2021 年创立。团​​队现有 18 名成员,其中约一半拥有博士学位,彰显了推动公司发展的专业知识和创新精神。

AudioShake 联合创始人兼首席执行官 Jessica Powell 表示:“从一开始,我们就与内容所有者携手打造 AudioShake,帮助他们开启新的创作机遇。与此同时,我们也看到了我们的技术在帮助机器通过声音理解现实世界方面的巨大潜力。这笔资金使我们能够在这两个方面取得进步。”

Alex Hartz,Shine Capital 普通合伙人认为 AudioShake 正在构建一个基础层,使音频能够像文本或图像一样灵活。每个音频文件都包含以前无法访问的多层信息。AudioShake 释放了这一价值。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/62028.html

(0)

相关推荐

发表回复

登录后才能评论