《Agentic Design Patterns:构建智能系统的实战指南》- 前言

书籍名称:Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems
本书作者:Antonio Gulli
链接地址:https://docs.google.com/document/d/1rsaK53T3Lg5KoGwvf8ukOUvbELRtH-V0LnOIFDxBryE
内容摘要:本文是对《智能体设计模式》一书前言部分的翻译,此章节介绍了本书的目录、引言等内容。

本书目录

前言

第一部分

  1. 提示链(Prompt Chaining)
  2. 路由(Routing)
  3. 并行化(Parallelization)
  4. 反思机制(Reflection)
  5. 工具调用(Tool Use)
  6. 规划(Planning)
  7. 多智能体(Multi-Agent)

第二部分

  1. 记忆管理(Memory Management)
  2. 学习与适应(Learning and Adaptation)
  3. 模型上下文协议(Model Context Protocol, MCP)
  4. 目标设定与监控(Goal Setting and Monitoring)

第三部分

  1. 异常处理与恢复(Exception Handling and Recovery)
  2. 人类在环路(Human-in-the-Loop)
  3. 知识检索/检索增强生成(Knowledge Retrieval / RAG)

第四部分

  1. 智能体间通信(Inter-Agent Communication, A2A)
  2. 资源感知优化(Resource-Aware Optimization)
  3. 推理技术(Reasoning Techniques)
  4. 安全防护与安全设计模式(Guardrails / Safety Patterns)
  5. 评估与监控(Evaluation and Monitoring)
  6. 优先级管理(Prioritization)
  7. 探索与发现(Exploration and Discovery)

附录

  • 附录 A:高级提示技术(Advanced Prompting Techniques)
  • 附录 B:从图形界面到真实世界环境的智能体(AI Agentic: From GUI to Real World Environment)
  • 附录 C:主流智能体框架概览(Quick Overview of Agentic Frameworks)
  • 附录 D:使用 AgentSpace 构建智能体(Building an Agent with AgentSpace)
  • 附录 E:命令行中的 AI 智能体(AI Agents on the CLI)
  • 附录 F:深入智能体推理引擎(Under the Hood: An Inside Look at the Agents’ Reasoning Engines)
  • 附录 G:编程型智能体(Coding Agents)

结语

引言

欢迎阅读《智能体设计模式:构建智能系统的实战指南》。纵观当今人工智能的发展图景,我们清晰地看到一种演进趋势:从简单的、被动响应的程序,逐步发展为能够理解上下文、自主决策,并与其环境及其他系统动态交互的复杂自主实体——这些就是智能体(intelligent agents)以及由它们构成的智能体系统(agentic systems)。

强大的大语言模型(LLM)的出现,为理解与生成类人文本和多模态内容提供了前所未有的能力,并成为许多智能体的“认知引擎”。然而,要将这些能力编排成能可靠实现复杂目标的系统,仅靠一个强大的模型是远远不够的。它还需要结构、设计,以及对智能体如何感知、规划、行动和交互的深思熟虑。

可以把构建智能系统想象成在画布(canvas)上创作一件复杂的艺术作品或工程作品。这里的“画布”并非空白的视觉空间,而是支撑智能体存在与运行的底层基础设施与框架——它为你构建智能应用提供了基础,用于管理状态、通信、工具访问以及逻辑流程。

要在这样的“智能体画布”上高效构建系统,不能只是随意堆砌组件。你需要掌握那些经过验证的设计模式(patterns)——它们能有效应对智能体行为设计与实现中的常见挑战。正如建筑模式指导房屋建造、软件设计模式规范代码结构一样,智能体设计模式(Agentic Design Patterns)为你在所选画布上赋予智能体生命时,提供可复用的解决方案。

什么是智能体系统?

从根本上说,智能体系统是一种计算实体,被设计用于:

  • 感知环境(包括数字环境,甚至物理环境);
  • 基于感知信息和预设或习得的目标做出决策
  • 自主执行行动以达成目标

与遵循固定、逐步指令的传统软件不同,智能体展现出一定程度的灵活性主动性

试想你需要一个系统来处理客户咨询。传统系统可能只会执行一套固定脚本;而一个智能体系统则能:

  • 捕捉客户问题的细微差别;
  • 访问知识库;
  • 与其他内部系统(如订单管理系统)交互;
  • 主动提出澄清问题;
  • 主动解决问题,甚至预测客户未来的需求。

这些智能体运行在你应用基础设施的“画布”之上,利用可用的服务与数据。

智能体系统通常具备以下特征:

  • 自主性(Autonomy):无需持续人工干预即可行动;
  • 主动性(Proactiveness):主动发起行动以推进目标;
  • 反应性(Reactiveness):能有效响应环境变化;
  • 目标导向(Goal-oriented):始终围绕目标工作;
  • 工具调用能力(Tool Use):可调用外部 API、数据库或服务,突破自身“画布”的边界;
  • 记忆能力(Memory):能在多次交互中保留信息;
  • 通信能力(Communication):可与用户、其他系统,甚至同一或关联“画布”上的其他智能体进行交流。

要有效实现上述特性,会带来显著的复杂性。例如:

  • 智能体如何在其画布上跨多个步骤维持状态?
  • 它如何决定何时以及如何使用工具?
  • 如何管理不同智能体之间的通信?
  • 如何构建系统韧性,以应对意外结果或错误?

为什么在智能体开发中“模式”至关重要?

正是这种复杂性,使得智能体设计模式不可或缺。它们并非僵化的规则,而是经过实战检验的模板或蓝图,为智能体领域中常见的设计与实现挑战提供已被验证的解决方案。

通过识别并应用这些设计模式,你将获得提升智能体结构清晰度、可维护性、可靠性与效率的有效手段。

使用设计模式可以帮助你避免为以下任务反复“造轮子”:

  • 管理对话流程;
  • 集成外部能力;
  • 协调多个智能体的行动。

它们提供了一种通用语言与结构框架,使你的智能体逻辑更清晰,便于他人(以及未来的你自己)理解和维护。采用专为错误处理或状态管理设计的模式,能直接提升系统的健壮性与可靠性。借助这些成熟方法,还能加速开发进程,让你聚焦于应用的独特价值,而非智能体行为的基础机制。

本书提炼出 21 个关键设计模式,它们是在各种技术“画布”上构建高级智能体的基本构件与核心技术。掌握并应用这些模式,将极大提升你设计与实现智能系统的能力。

本书概览与使用指南

《智能体设计模式:构建智能系统的实战指南》旨在成为一本实用且易读的资源。本书核心聚焦于清晰解释每个智能体模式,并提供具体、可运行的代码示例来演示其实现。

全书共 21 章,涵盖广泛的设计模式,从基础概念(如提示链(Prompt Chaining)和工具调用(Tool Use))到高级主题(如多智能体协作(Multi-Agent Collaboration)和自我修正(Self-Correction))。

本书按章节组织,每章深入探讨一个智能体模式。每章包含以下内容:

  • 模式概览:清晰解释该模式及其在智能体设计中的作用;
  • 实际应用与用例:展示该模式在现实场景中的价值与优势;
  • 动手代码示例:提供实用、可运行的代码,演示如何在主流智能体开发框架中实现该模式——这正是你学习如何在技术“画布”上应用模式的地方;
  • 关键要点:总结最重要的内容,便于快速回顾;
  • 参考文献:提供进一步学习的资源链接。

虽然章节按逻辑递进编排,但你完全可以将本书作为参考手册,直接跳转到解决你当前开发挑战的章节。

附录部分深入探讨了高级提示技术AI 智能体在真实环境中的应用原则,以及核心智能体框架概览。此外,我们还提供了仅在线提供的实战教程,手把手教你使用如 AgentSpace 和命令行界面等特定平台构建智能体。

全书强调实践应用,我们强烈建议你:

  • 运行代码示例;
  • 动手实验;
  • 将其改编为你自己的智能系统。

一个常见问题

我常听到一个问题:“AI 变化如此之快,为什么还要写一本可能很快过时的书?”

我的动机恰恰相反:正是因为变化太快,我们才更需要停下来,识别那些正在固化的核心原则

像 RAG(检索增强生成)、反思(Reflection)、路由(Routing)、记忆(Memory)等模式,正成为基础构建模块。本书邀请你反思这些核心理念——它们是我们未来构建更强大系统的基石。人类需要这样的时刻,来沉淀对基础模式的理解。

所用框架简介

为给代码示例提供一个具体的“画布”(参见附录),我们将主要使用三个主流的智能体开发框架:

  • LangChain 及其支持状态管理的扩展 LangGraph:提供灵活的方式将语言模型与其他组件串联起来,是构建复杂操作序列与图结构的强大“画布”;
  • Crew AI:专为编排多个 AI 智能体、角色与任务而设计的结构化框架,特别适合构建协作型智能体系统
  • Google 智能体开发工具包(Google ADK):提供构建、评估与部署智能体的工具与组件,是另一个宝贵的“画布”,常与 Google 的 AI 基础设施集成。

这些框架代表了智能体开发“画布”的不同面向,各有优势。通过在这些工具中展示示例,你将更广泛地理解:无论你选择何种技术环境,这些设计模式都能有效应用

所有示例都聚焦于清晰展示模式的核心逻辑及其在框架“画布”上的实现,强调清晰性与实用性。

结语

读完本书,你不仅将理解 21 个核心智能体设计模式背后的基本原理,还将掌握将其有效应用的实践知识与代码范例,从而在你选择的开发“画布”上,构建出更智能、更强大、更自主的系统。

现在,让我们开启这段动手实践的旅程!

什么让一个 AI 系统成为“智能体”?

简而言之,AI 智能体是一种被设计用来感知其环境并采取行动以实现特定目标的系统。它是标准大语言模型(LLM)的进化版本,增强了规划、使用工具以及与环境交互的能力。可以把“智能体式 AI”(Agentic AI)想象成一位在工作中不断学习的智能助手。它通过一个简单的五步循环来完成任务(见图1):

  1. 接收任务:你给它一个目标,比如“帮我安排日程”。
  2. 扫描环境:它收集所有必要信息——阅读邮件、查看日历、访问联系人——以理解当前状况。
  3. 思考策略:它制定行动计划,考虑达成目标的最佳方式。
  4. 采取行动:它执行计划,例如发送会议邀请、安排会议、更新你的日历。
  5. 学习与优化:它观察成功的结果并相应调整。例如,如果某次会议被重新安排,系统会从该事件中学习,以提升未来表现。
《Agentic Design Patterns:构建智能系统的实战指南》- 前言
图1:智能体式 AI 作为智能助手,通过经验持续学习。它通过一个简单的五步循环来完成任务。

智能体正以惊人的速度变得越来越流行。根据最新研究,大多数大型 IT 公司已在积极使用这些智能体,其中五分之一是在过去一年内才开始采用的。金融市场也注意到了这一趋势。截至 2024 年底,AI 智能体初创公司已筹集超过 20 亿美元资金,市场规模达到 52 亿美元。预计到 2034 年,这一市场将飙升至近 2000 亿美元。简言之,种种迹象表明,AI 智能体将在未来的经济中扮演极其重要的角色。

短短两年内,AI 范式发生了巨大转变,从简单的自动化迈向了复杂的自主系统(见图2)。最初,工作流依赖基础提示(prompt)和触发器,通过 LLM 处理数据。随后,检索增强生成(RAG)技术出现,通过将模型建立在事实信息基础上,提高了可靠性。接着,我们看到了能够使用多种工具的单个 AI 智能体的发展。如今,我们正进入智能体式 AI(Agentic AI)时代——多个专业化智能体协同工作,以实现复杂目标,这标志着 AI 协作能力的重大飞跃。

《Agentic Design Patterns:构建智能系统的实战指南》- 前言

本书旨在探讨专业化智能体如何协同工作、相互协作以实现复杂目标的设计模式,每一章都将展示一种协作与交互的范式。

在此之前,让我们先来看一些涵盖不同智能体复杂程度范围的示例(见图3)。

《Agentic Design Patterns:构建智能系统的实战指南》- 前言
图3:展示智能体复杂性范围的不同实例

第0级:核心推理引擎

虽然大语言模型(LLM)本身并不是智能体,但它可以作为基础智能体系统的推理核心。在“第0级”配置中,LLM 不具备工具、记忆或环境交互能力,仅基于其预训练知识进行响应。它的优势在于利用庞大的训练数据解释已确立的概念。但这种强大内部推理的代价是完全缺乏对当前事件的感知能力。例如,如果“2025年奥斯卡最佳影片”得主的信息不在其预训练数据中,它就无法回答。

第1级:连接式问题解决者

在此级别,LLM 通过连接并使用外部工具,成为一个功能性智能体。其问题解决能力不再局限于预训练知识,而是能够执行一系列操作,从互联网(通过搜索)或数据库(通过检索增强生成,RAG)等外部来源获取和处理信息。(详见第14章)

例如,要寻找新上映的电视剧,该智能体会意识到需要最新信息,于是调用搜索工具获取结果,并对结果进行综合。更重要的是,它还能使用专业工具以获得更高精度,比如调用金融 API 获取苹果公司(AAPL)的实时股价。这种跨多个步骤与外部世界交互的能力,是第1级智能体的核心特征

第2级:战略性问题解决者

在此级别,智能体的能力显著扩展,涵盖战略规划、主动协助和自我改进,而提示工程(prompt engineering)与上下文工程(context engineering)是其关键支撑技能。

首先,智能体不再局限于单工具使用,而是能通过战略性问题解决处理复杂的多步骤任务。在执行一系列操作时,它会主动进行上下文工程——即有策略地选择、打包和管理每一步所需的关键信息。例如,要在两个地点之间找一家咖啡馆,它先使用地图工具,然后对输出结果进行上下文工程,仅提取街道名称等关键信息,作为精简、聚焦的上下文输入给本地搜索工具,避免认知过载,确保第二步高效准确。

要让 AI 达到最高精度,必须为其提供简短、聚焦且有力的上下文。上下文工程正是通过策略性地从所有可用信息源中筛选、打包和管理最关键的信息,有效引导模型有限的注意力,防止信息过载,从而确保在任何任务上都能高效、高质量地执行。(详见附录 A)

这一级别还支持主动且持续的运行。例如,一个与你邮箱连接的旅行助手,能从冗长的航班确认邮件中提取关键信息(如航班号、日期、地点),打包后用于后续的日历更新和天气 API 调用。

在软件工程等专业领域,智能体可管理整个工作流。当收到一个 bug 报告时,它会读取报告并访问代码库,然后将这些大量信息通过上下文工程提炼成一个精炼、聚焦的上下文,从而高效地编写、测试并提交正确的代码补丁。

最后,智能体通过优化自身的上下文工程流程实现自我改进。例如,当它主动请求反馈“这个提示该如何改进?”时,实际上是在学习如何更好地筛选初始输入。这使其能自动优化未来任务中的信息打包方式,形成一个强大的自动化反馈循环,持续提升准确性和效率。(详见第17章)

第3级:协作型多智能体系统的兴起

在第3级,AI 发展范式发生重大转变:不再追求单一全能的“超级智能体”,而是转向复杂的协作型多智能体系统。本质上,这种方法认识到:复杂挑战往往最好由一组专家智能体协同解决,而非依赖单一通才。这种模式直接模仿人类组织结构——不同部门承担特定角色,协同应对多维度目标。系统的整体优势正来自于这种分工协作与协同效应。(详见第7章)

举个例子:新产品上市的复杂流程。与其让一个智能体处理所有事务,不如由一个“项目经理”智能体担任中央协调者,统筹整个流程,并将任务分配给其他专业化智能体:

  • “市场调研”智能体收集消费者数据,
  • “产品设计”智能体开发概念,
  • “市场营销”智能体制作宣传材料。

它们成功的关键在于无缝沟通与信息共享,确保所有个体努力都对齐于共同目标。

尽管这种自主团队式自动化的愿景已在开发中,但仍需正视当前挑战:

  • 多智能体系统的效能仍受限于所用 LLM 的推理能力;
  • 它们能否真正相互学习、作为一个整体持续改进,尚处于早期阶段。

克服这些技术瓶颈是下一步的关键。一旦实现,将释放第3级的巨大潜力:从头到尾自动化整个业务工作流

智能体的未来:五大假设

AI 智能体在软件自动化、科学研究、客户服务等领域的进展前所未有。尽管当前系统已令人印象深刻,但这只是开始。下一波创新将聚焦于让智能体更可靠、更协作、更深度融入我们的生活。以下是关于未来的五大主流假设(见图4):

《Agentic Design Patterns:构建智能系统的实战指南》- 前言
图4:关于智能体未来的五大假设

假设1:通用智能体的出现

AI 智能体将从狭窄的专家演变为真正的通用智能体,能够以高可靠性管理复杂、模糊且长期的目标。例如,你只需给出一个简单指令:“为我公司在下个季度于里斯本组织一场30人的团建活动。”该智能体便能持续数周管理整个项目,处理从预算审批、机票谈判、场地选择到根据员工反馈制定详细行程等所有事务,并定期汇报进展。

实现这种自主性需要在 AI 推理、记忆和近乎完美的可靠性方面取得根本性突破。

另一种(非互斥的)路径是小型语言模型(SLM)。这种“乐高式”理念主张通过组合多个小型专业化智能体来构建系统,而非依赖单一庞大的模型。这种方法有望带来更便宜、更易调试、更易部署的系统。

最终,大型通用模型的发展与小型专家模型的组合,可能是两条并行甚至互补的路径。

假设2:深度个性化与主动目标发现

智能体将成为深度个性化且主动的伙伴。我们正见证一类新型智能体的出现:主动型伙伴。通过学习你独特的行为模式与目标,这些系统正从“被动执行指令”转向“主动预见需求”。

当 AI 系统不仅能响应聊天或指令,还能主动发起并代表用户执行任务,并在过程中积极协作时,它就真正成为了智能体。这已超越简单任务执行,进入主动目标发现的领域。

例如,如果你正在探索可持续能源,智能体可能会识别出你潜在的目标,并主动为你推荐相关课程或总结最新研究。尽管这类系统仍在发展中,但其方向明确:它们将越来越主动,在高度确信某项行动对你有益时,便主动采取行动。最终,智能体将成为不可或缺的盟友,帮助你发现并实现那些你尚未完全明确的抱负。

假设3:具身化与物理世界交互

该假设预测,智能体将突破纯数字世界的限制,进入物理世界。通过将智能体式 AI 与机器人技术结合,我们将迎来“具身智能体”(embodied agents)。

例如,你不再需要预约水管工,而是对家中的智能体说:“修好漏水的水龙头。”该智能体会利用视觉传感器感知问题,调用管道维修知识库制定计划,并精确控制机械臂完成维修。

这将是里程碑式的跨越,弥合数字智能与物理行动之间的鸿沟,彻底改变制造业、物流、老年护理乃至家庭维修等领域。

假设4:智能体驱动的经济

高度自主的智能体将成为经济的积极参与者,催生全新市场与商业模式。我们可以设想智能体作为独立的经济实体,被赋予特定目标(如利润最大化)。

一位创业者可部署一个智能体来运营整个电商生意:它能分析社交媒体识别流行商品、生成营销文案与视觉内容、与其他自动化系统交互管理供应链,并根据实时需求动态调整定价。

这种转变将催生一个全新的、超高效的“智能体经济”,其运行速度与规模远超人类直接管理的能力。

假设5:目标驱动的、可变形的多智能体系统

该假设认为,未来将出现不依赖显式编程、仅凭目标声明即可运作的智能系统。用户只需声明期望结果,系统便能自主规划实现路径。这标志着向可变形多智能体系统(metamorphic multi-agent systems)的根本转变——系统能在个体与集体层面实现真正的自我改进。

这种系统是动态实体,而非单一智能体。它能分析自身表现,并动态调整其多智能体团队的结构:按需创建、复制或移除智能体,以组建最适合当前任务的团队。这种演化发生在多个层面:

  • 架构修改:在最深层,单个智能体可重写自身源代码,重构内部结构以提升效率(如原始假设所述)。
  • 指令修改:在更高层,系统持续进行自动提示工程与上下文工程,不断优化给每个智能体的指令与信息,确保其在无人干预下获得最优引导。

例如,一位创业者只需声明:“开一家成功的精品咖啡电商。”系统无需进一步编程便会立即行动。它可能先生成一个“市场调研”智能体和一个“品牌建设”智能体;根据初步发现,它可能移除品牌智能体,转而生成三个新专家:

  • “Logo 设计”智能体,
  • “网店平台”智能体,
  • “供应链”智能体。

它还会持续优化各智能体的内部提示。如果网店智能体成为瓶颈,系统可能将其复制为三个并行智能体,分别处理网站不同模块——实时重构自身架构,以最高效达成目标

结论

本质上,AI 智能体代表了从传统模型的重大飞跃——它是一个能感知、规划并行动以实现特定目标的自主系统。该技术正从单一工具型智能体,演进为能处理多维度目标的复杂协作型多智能体系统。

未来假设预示着通用型、个性化乃至具身化的智能体将涌现,并成为经济活动的积极参与者。这一持续发展标志着范式的根本转变:迈向自我改进、目标驱动的系统,这些系统将自动化整个工作流,并从根本上重塑我们与技术的关系。

参考文献

  1. Cloudera, Inc. (April 2025), 96% of enterprises are increasing their use of AI agents.https://www.cloudera.com/about/news-and-blogs/press-releases/2025-04-16-96-percent-of-enterprises-are-expanding-use-of-ai-agents-according-to-latest-data-from-cloudera.html
  2. Autonomous generative AI agents: https://www.deloitte.com/us/en/insights/industry/technology/technology-media-and-telecom-predictions/2025/autonomous-generative-ai-agents-still-under-development.html
  3. Market.us. Global Agentic AI Market Size, Trends and Forecast 2025–2034. https://market.us/report/agentic-ai-market/

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论