Google AI 发布 Vertex AI 记忆库:实现持久代理对话

开发人员正在积极致力于将人工智能代理(AI Agent)推向市场,但一个重大障碍是缺乏记忆。由于无法回忆过去的互动,代理会将每次对话都视为第一次,导致重复提问、无法记住用户偏好,以及普遍缺乏个性化。这让用户和开发人员都感到沮丧。

过去,开发人员曾尝试通过将整个会话对话直接插入 LLM 的上下文窗口来缓解此问题。然而,这种方法成本高昂且计算效率低下,导致推理成本更高、响应时间更慢。此外,输入过多信息(尤其是无关细节)会降低模型的输出质量,导致“中途丢失”和“上下文衰减”等问题。

Vertex AI 记忆库简介

为了克服这些限制,Google Cloud 宣布推出Memory Bank的公开预览版,这是Vertex AI Agent Engine中的一项新托管服务。Memory Bank 旨在帮助您构建高度个性化的对话代理,以促进更自然、更具情境性和持续性的互动。

Google AI 发布 Vertex AI 记忆库:实现持久代理对话

例如,这里有一个个性化医疗代理:需要过去会话中提到的有关用户过敏和先前症状的关键信息,以便在当前会话中提供更明智的响应

Memory Bank 通过几个关键方法解决了基本的记忆问题:

  • 个性化互动:它超越了通用脚本,通过记住用户偏好、关键事件和过去的选择来定制每个响应。
  • 保持连续性:即使跨越数天或数周的多个会话,对话也可以无缝地从中断的地方继续。
  • 提供更好的背景信息:代理掌握用户的必要背景信息,从而提供更相关、更有见地和更有帮助的回应。
  • 改善用户体验:消除用户重复信息的挫败感,创造更自然、更高效、更引人入胜的对话。

Memory Bank 的工作原理

Memory Bank 通过智能、多阶段流程运作,利用谷歌的 Gemini 模型和新颖的研究:

  • 理解并提取记忆:记忆库分析用户的对话历史记录(存储在代理引擎会话中),以提取关键事实、偏好和上下文。此过程在后台异步进行,无需开发人员构建复杂的提取流程即可生成新的记忆。
  • 智能存储和更新记忆:关键信息(例如“我喜欢阳光明媚的日子”)会根据用户 ID 等特定范围进行存储和整理。当新信息出现时,记忆银行会利用 Gemini 将其与现有记忆整合,解决矛盾之处,并确保记忆保持最新状态。
  • 回忆相关信息:当新的对话会话开始时,代理可以检索这些存储的记忆。这种检索可以是简单地回忆所有事实,也可以是使用嵌入进行更高级的相似性搜索,以查找与当前主题最相关的记忆。这确保代理始终具备正确的上下文。

整个过程以谷歌研究院的创新研究方法为基础,该方法已被 ACL 2025 采纳。该方法提供了一种基于主题的智能方法,用于研究代理如何学习和回忆信息,从而为代理的记忆性能树立了新的标杆。例如,个人美容伴侣代理可以记住用户不断变化的肤质,从而提供个性化的产品推荐。

Memory Bank 入门

Memory Bank 与代理开发工具包 (ADK)代理引擎会话 (Agent Engine Sessions)集成。开发人员可以使用 ADK 定义代理,并启用代理引擎会话来管理各个会话中的对话历史记录。之后,可以启用记忆银行,为多个会话提供长期记忆。

您可以通过两种主要方式将 Memory Bank 集成到您的代理中:

  • 使用Google 代理开发套件 (ADK)开发代理以获得开箱即用的体验。
  • 如果您使用任何其他框架(包括 LangGraph 和 CrewAI 等流行框架)构建代理,请开发一个代理来协调对 Memory Bank 的 API 调用。

对于刚接触 Google Cloud 但使用 ADK 的用户, Agent Engine Sessions 和 Memory Bank 的快速模式注册允许您使用 Gmail 帐户注册以接收 API 密钥并在免费层使用配额内构建,然后无缝升级到完整的 Google Cloud 项目进行生产。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/59700.html

(0)

相关推荐

发表回复

登录后才能评论