Willow 是一家获得 Y Combinator 投资的语音 AI 初创公司,该公司刚刚发布了一款 iOS 键盘应用,用户可以在所有 iPhone 和 iPad 应用中进行语音输入,并拥有完整的编辑功能。这家由斯坦福大学辍学生创立的公司已筹集了 450 万美元,用户月增长率高达 50%,在蓬勃发展的语音界面市场中,他们正与资金雄厚的竞争对手(例如Wispr Flow)展开角逐。

iOS 上的语音 AI 迎来重大突破。由 Y Combinator 支持的初创公司Willow发布了其语音键盘应用,将 AI 驱动的语音输入功能引入到每一款 iPhone 和 iPad 应用中——其独特之处在于,它与竞争对手截然不同。
与现有解决方案不同,Willow 将语音转录与全键盘 QWERTY 键盘相结合,使用户无需切换键盘即可在语音和文字输入之间无缝切换。该应用支持 100 多种语言,并采用Meta的 Llama 模型进行上下文格式化和个性化设置。
“我们在研究医疗保健解决方案时注意到,医生们使用语音AI记录器来记录与患者的对话,并创建后续跟进文档,”联合创始人 Allan Guo 表示。“这促使我们为知识工作者和其他用户开发一款语音AI工具。”
这家公司的创立故事堪称硅谷经典转型案例。Allan Guo 和联合创始人 Lawrence Liu 从斯坦福大学辍学,最初专注于为养老机构开发医疗保健软件。但这条路走不通后,他们花了一年时间探索各种不同的想法,最终确定了语音输入技术。
时机可谓恰到好处。现代人工智能模型已显著提升了语音识别的准确率,为初创公司挑战苹果内置的语音输入工具创造了机会。Willow 的关键优势在于其混合式方法,用户可以先进行语音输入,然后立即使用全键盘进行编辑,而无需在不同界面之间切换。
Willow 选择避开竞争激烈的 AI 笔记市场,转而瞄准会议之外的日常沟通。该公司在其产品线中运用了多种模型,重点关注文本到文本的处理,以实现格式化和个性化。
自推出以来,Willow 的用户月增长率高达 50%,并已成功吸引Uber、Heidi Health 和 Zeg 等企业客户。这些公司利用 Willow 的自定义词汇功能,满足团队特定的语音输入需求。
这家初创公司从 Box Group、Y Combinator、Burst Capital 以及包括 HubSpot 的 Dharmesh Shah、Reddit联合创始人 Alexis Ohanian 和Instacart联合创始人 Max Mullen 在内的知名天使投资人那里筹集了 450 万美元。
“我非常欣赏 Allan 的远见卓识,他不仅致力于打造一款优秀的语音识别应用,而且着眼于长远,力求创建一个能够控制电脑的界面,”Mullen 说道。“使用Willow写作时,我需要修改的次数比使用电脑内置的语音识别系统要少得多。”
Willow在语音AI领域面临着激烈的竞争。Wispr Flow已融资超过5600万美元,并提供类似的功能,但仅配备数字键盘用于编辑。其他Y Combinator孵化的公司,如Aqua、Talktastic、Superwhisper和Betterdictation,也正从不同的角度进军语音识别市场。
桌面版包含一个名为“Hey Willow”的语音助手,能够以用户的语音风格回复邮件,这预示着人工智能界面将朝着更宏伟的目标迈进。这种以语音为先的计算理念与投资者对未来用户界面的预测不谋而合。
Willow 计划在未来几个月内将平台扩展到 Windows 和 Android 系统,并改进个性化功能以减少手动编辑。该路线图表明,Willow 将语音输入视为更广泛的语音控制计算的起点。
Willow 的 iOS 版本发布标志着语音界面迈向新的发展阶段,它将人工智能的精准度与现有解决方案所缺乏的实用编辑功能相结合。凭借强大的投资者支持、快速的用户增长和企业级应用的认可,这家初创公司已做好充分准备,挑战内置语音识别工具和资金雄厚的竞争对手。随着下一代用户界面竞争日趋激烈,Willow 能否真正兑现其关于语音控制计算的宏伟愿景,将是对其真正的考验。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/63012.html