Deepgram 推出 Saga:面向开发人员的人工智能语音接口

专门为企业开发语音合成和对话技术的人工智能平台开发商 Deepgram 公司今天发布了一款专为开发人员设计的语音 “操作系统”。

这一新工具名为 Saga,它是一个通用语音接口,可直接嵌入开发人员的环境中,让他们仅凭声音就能控制工具和代码。该公司表示,新的助手(或称 “copilot”)位于现有工具之上,允许开发人员将粗略的想法转化为人工智能编码提示,而无需在窗口之间切换。

现代开发人员使用大量不同的工具,经常使用多个显示器,在导入和文件之间跳来跳去,以粗略地勾勒出他们的想法。他们一边导入代码,一边试图弄明白为什么解释器看不到他们正在处理的内容的上下文。

Deepgram 称这种切换是对生产力的“无声税”,它是由 alt-tab 键切换、在显示器之间浏览、在文件之间查看、测试并最终部署代码而产生的,只是为了看着错误弹出。

“说话比打字快,阅读比写作快。Deepgram 首席执行官兼联合创始人 Scott Stephenson 说:”现代开发人员堆栈仍有待重新设计,将人工智能作为一流的操作模式。开发人员花费了太多的精力在工具之间切换,而不是进行构建。”

Stephenson 表示,通过用语音而非简单的按键来重新构想开发流程,开发人员可以在电脑前获得完全不同的体验。也许对于那些在其他以热键为常态的环境中长大的人来说,热键操作似乎很快,但语音听起来更自然——尽管在开放式办公室里,这可能会引起一些人的侧目。

Deepgram 推出 Saga:面向开发人员的人工智能语音接口

据 Deepgram 介绍,Saga 可以轻松与 Cursor 和 Windsurf 等众多 AI 原生编码环境集成,并可在 Linear、Asana、Jira 或 Slack 等项目管理软件中维护状态更新。用户还可以将其用于日常任务,例如要求其从 Google 文档、Gmail 或 Google 表格中提取信息,并将其合并到代码中,或者仅告知用户所需的信息。

开发人员可以向助手表达他们的想法,例如说:“创建一个响应表情符号的 Slack 机器人。”作为回应,Saga 会将他们的想法转换成可与 Cursor 等工具一起使用的一次性提示。

该工具还可用于加快文档、票证或描述符的速度,使开发人员能够在漫长的编码期结束时轻松完成原本费力的打字工作。

该公司表示,Saga 的设计目标不仅仅是一个助手,而是一个可以融入其整个工作流程的“可编程操作系统”。为此,Saga 通过模型上下文协议 (Model Context Protocol)进行交互,该协议将 AI 模型连接到数据集和工具,以及各种标准接口。这使得团队可以轻松地将其连接到任何设置、开发环境或集成。

Deepgram 高级产品经理 Sharon Yeh 表示:“Saga 代表着一种根本性的转变——它填补了传统语音助手的空白,将语音作为接口使用。我们不会要求开发者学习新的命令或更换他们的工具。我们通过语音将想法转化为执行的最快途径,为他们提供了一种自然的方式来协调完整的工作流程。”

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/59561.html

(0)

相关推荐

发表回复

登录后才能评论