图书前言

行业名家力荐

单体智能已成往事,多智能体协作才是未来的主宰。本书精准定义了AI的未来形态:通过协作构建广度,借助反思与进化获得灵魂。这不仅是设计模式,更是极客驾驭复杂智能系统的底层法则。坚定地掌握它,因为下一代AI正由此诞生。

韩艾|京东集团算法总监  OxyGent开源项目多智能体协作框架总架构师

第一时间拿到茹炳晟老师翻译的《Agentic智能体设计模式》,读起来非常过瘾。当前AI正从“模型能力”走向“系统能力”,真正的挑战已经不只是模型本身,而是如何设计能够规划、协作与行动的Agent系统。本书从工程实践出发,将智能体开发中的关键结构与模式梳理得清晰而具体,对于希望把AI真正做成系统的工程师来说,是一本很有启发价值的实践指南。

黄佳|新加坡科研局高级工程师  “咖哥AI”系列图书作者

人工智能正从生成式对话迈向具备自主规划与执行能力的智能体系统,这一范式变革不仅是技术的进化,更是软件工程思维的深刻重构。对于开发者而言,如何通过缜密的架构设计将大模型能力转化为负责任的工程化系统,是一个必须回答的问题,而这本书将提供一份非常有实战价值的工程指南。

 马杰|零一万物联合创始人 

硅谷的趋势:PRD已死,智能体是未来。在万物都值得被AI重做一遍的时代,我们古典产品经理必须把已有的知识和技能,用智能体刷新。产品经理谦逊的自我再教育是当务之急,邀请同行加入一起学习的行列。

潘农菲|管理学博士  产品经营顾问

人工智能正从文本生成迈向自主执行、协同决策的Agentic智能体时代,这不仅是技术范式的跃迁,更是金融机构数字化转型与智能化升级的核心方向。本书恰逢其时,以工程化、可落地的设计模式,为复杂智能体系统搭建提供了清晰的路径。

作为长期深耕金融科技与数字化架构的技术管理者,我亲历了AI从模型能力走向工程落地的关键转折。本书精确切中了金融机构智能化转型的核心痛点——如何把大模型能力,变成可控、可靠、可规模化应用的生产力。

相信本书将成为科技从业者的案头指南,推动Agentic技术在各业务领域规模化落地,开启安全可靠、提质增效的新篇章。

石杰|杭银消费金融股份有限公司CTO

当前,大模型正处于从"对话式AI"迈向"行动式AI"的关键转折点,Agent设计模式已成为连接模型能力与产业落地的核心桥梁。这本著作恰逢其时,系统梳理了21种经过实战验证的设计模式——从提示链、路由、并行化到多智能体协作、MCP协议等前沿架构,以及评测、安全、记忆等重要话题,并辅以主流框架的代码示例。在Agentic AI市场被预测将达万亿美元规模的今天,本书为架构师和开发者提供了从理论到实践的完整认知框架,是把握智能体技术浪潮、推动企业级Agent系统落地的必备指南。

章鹏|蚂蚁数科AI技术负责人、大模型技术创新部总经理

开启智能体的工程化时代

生成式 AI 的上半场比拼的是模型能力,下半场决胜的是工程水平。

过去两年,大模型以席卷之势走出实验室、走进人们的生活,也开始走进产业现实,但很多组织都存在一个困境:做一个炫酷的演示很容易,打造一套稳定、可信、规模化的生产级系统却很难。新的概念层出不穷、新的技术日新月异,落地路径却模糊不清;模型的能力被反复验证,产业的价值却迟迟无法体现。瓶颈不在于技术,而在于工程。

当我们真正走进业务现场就会发现,开发者面对的从来不是 “智能体是什么”,而是一系列必须被严谨解决的工程难题:模型与工具如何可靠地交互?多智能体并行如何避免混乱?系统如何满足金融、工业、政务场景下刚性的合规、鲁棒与可解释要求? 

《Agentic智能体设计模式》正是在这一转折点上,给出了兼具深度与实用性的工程答案,标志着AI 从提示词工程走向系统架构工程。

本书的作者团队兼具顶尖科技企业架构经验与大规模企业落地实践经验,全书没有空谈概念,而是把复杂的智能体体系揉碎,打造成可理解、可复用、可演进的工程模式。他回答了企业最关心的问题:如何从一个单体智能体,平稳、可控、低损耗地演进为分布式协同体系;如何把不确定性的 AI 能力,封装为确定性的业务能力;如何在复杂环境下治理协同、保障安全、实现可解释与可追溯。

这本书的价值体现在三个真正面向产业的方面。

有序的架构演进:它以成熟度模型为线索,给出从基础单体到高阶多智能体的清晰路径,让企业实现阶梯式升级。

可复用的设计模式:它将最佳实践沉淀为容错、自愈、共识、合规、协同等一系列可直接落地的模式,把经验沉淀为范式。

实战化的业务落地:它以贷款审批、供应链协同等真实场景为载体,讲透框架选型、分布式治理、人在回路、安全隔离等关键环节,把纸上架构变成可运行的系统。

对软件架构师、AI 工程师与技术负责人而言,这是一本可以放在案头、随时查阅的工程手册。它把群体智能从愿景变成了可工程化、可运维、可治理的现实。

智能体工程化的时代已经到来,相信每一位致力于让 AI 产生真实业务价值的从业者,都能在这本书中找到方向、方法与底气。

朱征宇

上海流程智造科技创新研究院常务副院长

从“对话”到“行动”

——设计模式重构智能体的边界

2025年,人工智能的叙事正在发生深刻的位移。聚光灯不再仅仅聚焦于大模型的参数规模或上下文长度,而是转向了一个更具潜力的方向:如何让AI从“对话者”转变为“行动者”。这正是Agentic的核心命题,也是Antonio Gullí先生这本Agentic Design Patterns问世的重要背景。作为译者,我们在翻译本书的过程中,深切感受到技术范式转换之际的激动与责任,愿借此机会与中文读者分享一些心得。

一、为什么是“设计模式”,为什么是“现在”

在软件开发的历史中,“设计模式”的出现总是标志着一个领域从萌芽走向成熟。1994年,GoF的《设计模式》为面向对象编程提供了经典语汇;今天,Agentic设计模式的提出,则预示着智能体开发正在经历类似的“经典化”进程。Antonio Gullí是一位拥有三十余年经验的AI“老兵”,他在书中呈现的21种模式并非凭空想象的理论框架,而是从大量工程实践中提炼的“最佳答案”的集合。

当前的现实是,许多开发者仍将智能体简单地理解为“大模型+工具调用”。这种认知虽然直观,却往往导致系统在面对复杂任务时显得脆弱、不可控,甚至出现“提线木偶”式的机械响应。真正的智能体需要具备感知、规划、记忆、反思与协作的能力。正如书中所言,构建有效的Agentic系统,需要的不仅是大模型的“原始能力”,更是稳健的“架构蓝图”。

二、从“提示词工程”到“系统架构设计”

传统的提示词工程,往往在单次交互的微观层面雕琢;而Agentic设计模式,则将视野拉升到了系统架构的宏观层面。

本书的第I部分围绕“核心执行”展开,从最基础的提示链(将复杂任务拆解为流水线)到路由(动态选择处理路径),再到并行化与反思,帮助开发者建立起可组合、可维护的工作流。

更具前瞻性的是“反思”模式。传统程序执行即结束,而具备反思能力的智能体能够自我批判、迭代优化。无论是代码生成后的自动调试,还是文本撰写后的润色重写,这种“自我纠错”机制使得智能体不再是一个僵硬的执行者,而更像一个不断进步的协作者。

当然,智能体的终极形态并非单打独斗。书中详细阐述的多智能体协作模式,展现了“集体智慧”的魅力。在解决复杂问题时,由不同专长的智能体(如研究员、分析师、审查员)组成的“虚拟团队”,其效能远超单个通用智能体。这种类似于“项目经理”与“专家”协同的工作方式,正在重新定义企业级应用的开发范式。

三、不仅仅关乎技术,更关乎“落地”

在翻译过程中,我们深刻感受到作者对技术落地的务实态度。书中不仅浓墨重彩地讨论了“记忆管理”“工具使用”等增强能力的模式,更花了大量篇幅在“异常处理”“人在回路”和“安全护栏”上。这反映出业界对智能体从“实验室玩具”走向“生产级工具”的严肃思考:系统不仅要聪明,更要安全、可控、可观测,这些都是技术“落地”的基石。

四、致中文版读者:机遇与挑战并存

对于中文世界的开发者而言,本书的出版恰逢其时。国内的大模型生态正蓬勃发展,但如何将模型能力转化为解决实际业务问题的智能体,依然是许多团队的瓶颈。一些企业实践中,由于缺乏标准化的设计模式,导致代码重复率极高、系统迭代困难。本书提供的这21种模式,就像21块精心打磨的“乐高积木”,让开发者能够从“手工作坊”式的定制开发,迈向“智能工厂”式的标准化搭建。

当然,我们也要保持清醒的头脑。模式是“路标”,而非“终点”。Agentic技术目前仍处于快速演进之中,本书所依托的LangChain、CrewAI等框架也在不断迭代。但我们相信,书中所揭示的底层原则——如“规划-执行-验证”的闭环、“记忆与工具的解耦”、“安全护栏的嵌入”——将成为智能体领域相对稳定的基石,帮助大家在变化的技术浪潮中把握本质。

最后,感谢清华大学出版社的信任与支持,也感谢每一位翻开此书的读者。Agent之路,道阻且长,行则将至。愿本书能成为你构建下一代智能系统路上的忠实伙伴。

茹炳晟 方佳璐

2026年3月

献给我的儿子Bruno:两岁的你,如一道崭新而耀眼的光芒,照亮我的生活。当我在探索那些将定义人类未来的系统时,心中最先想到的,便是你终将继承的这个世界。

献给我的儿子Leonardo 和 Lorenzo,以及我的女儿Aurora:你们成长为如此优秀的人,正努力建设一个更美好的世界,我心中满是对你们的骄傲。

这本书探讨的是智能工具的构建之道,却承载着我深切的期许:愿你们这一代人,能以智慧与同理心指引这些工具的发展。倘若我们能学会运用这些强大的技术造福人类、推动社会进步,那么无论是对你们,还是对我们所有人而言,未来都将一片光明。

作者简介

安东尼奥·古利(Antonio Gullí)是谷歌公司的一位经验极为丰富的高级总监,目前担任首席技术官办公室的工程总监一职。他拥有超过30年的相关行业经验,是业内知名人物,在人工智能、搜索引擎和云计算领域具有深厚的专业背景,拥有11项已授权专利和27项正在申请中的专利。

安东尼奥的职业经历遍及六个欧洲国家,积累了丰富的国际经验。他曾在爱思唯尔(任副总裁)、微软(任必应搜索站点负责人)、Ask.com(任欧洲区首席技术官)以及谷歌在波兰、英国和瑞士的分公司的多个岗位任职,这些经历为他带来了宝贵的行业洞察。他还是一位连续创业者,创立了多家公司,包括意大利的第一个搜索引擎公司,该引擎也是全球最早的搜索引擎之一。他同时是一名天使投资人。

安东尼奥的教育背景同样卓越,拥有比萨大学计算机科学博士学位、工程学硕士学位、实践工程学硕士学位及计算机科学学士学位。他的技术专长涵盖高级软件工程、人工智能、搜索、云原生技术(Kubernetes)、Keras及深度学习等领域。此外,安东尼奥还兼任董事会成员和风险投资顾问,是极具价值的专业人才。

译者简介

茹炳晟,腾讯研究院特约研究员,复旦大学CodeWisdom团队首席技术专家,中国计算机学会(CCF)TF研发效能SIG主席,中国商业联合会互联网应用技术委员会智库专家,中国通信标准化协会TC608云计算标准和开源推进委员会云上软件工程工作组副组长,腾讯云架构师技术同盟入会主席,年度IT图书最具影响力作者,二十余本技术畅销书的作者和译者,国内外各大技术峰会的联席主席、出品人和Keynote演讲嘉宾,公众号“茹炳晟聊软件研发”的主理人。

方佳璐,杭银消费金融股份有限公司线上信贷质量负责人,浙江大学计算机学院人工智能专业毕业,曾任职于华为、阿里巴巴;译有《大模型驱动的软件测试:从理论到实践》,获评“影响力译者”,多次参加QECon、CCF等技术峰会并进行主题分享。

人工智能领域正迎来一个激动人心的转折点。我们已不再满足于仅能处理信息的模型,而是朝着能够推理、规划并执行具体行动的智能系统迈进——即使任务目标不够明确,这类系统也能顺利完成复杂工作。正如本书所言,这些被称为“自主智能体”的系统,正代表着人工智能的下一个前沿;而研发这类系统所带来的挑战,既令我们感到振奋,也激励着 Google 团队的每一位成员。

本书的问世恰逢其时,为我们的探索之路提供了清晰指引。书中明确指出,大语言模型是此类自主智能体系统的核心——“大脑”,而要充分发挥其强大能力,就必须依靠清晰的结构设计与周密的规划。正如设计模式曾凭借通用语言和可复用的解决方案彻底改变软件工程一样,本书所阐述的自主智能体设计模式,也将成为构建稳定、可扩展、高可靠智能系统的重要基石。

书中将构建自主智能体的过程比喻为绘制“画布”,这与我们在 Google Vertex AI 平台上的工作理念高度契合。我们始终致力于为开发者打造功能强大、灵活度极高的“画布”,以助力下一代人工智能应用的开发。而本书所提供的,正是能够直接落地的实践指导,帮助开发者充分释放这块“画布”的潜能。无论是提示链的搭建、工具调用方法,还是智能体之间的协作、系统的自我修正、安全保障与风险防护,书中均透彻解析了各类实用模式,堪称所有致力于开发复杂 AI 智能体的开发者手中的全能工具箱。

人工智能的未来,将由那些能够构建此类智能系统的开发者的创造力与智慧所塑造。本书正是释放这份创造力的关键指南。它不仅阐明了自主智能体系统“是什么”以及“为何如此重要”,更通过实际案例给出了“如何实现”的具体答案。

看到这本书即将抵达开发者手中,我由衷感到欣喜。书中所呈现的设计模式与核心原则,必将推动更多兼具创新性与实用价值的 AI 应用加速诞生——而这些应用,将在未来多年里持续深刻地改变我们的世界。

Saurabh Tiwary

Google CloudAI 副总裁兼总经理

美国加利福尼亚州伯克利市

思想领袖的视角:力量与责任

过去四十余年间,我亲历了多轮技术变革的浪潮——从个人电脑与互联网的诞生,到移动技术与云计算带来的颠覆,却从未有一次如当下这般令人心潮澎湃。长期以来,关于人工智能的讨论总是在狂热追捧与失望低谷之间来回摇摆,短暂的“人工智能之夏”之后,往往是漫长而沉寂的“寒冬”。然而这一次,氛围已然不同。

如果说过去18个月,行业的焦点是大语言模型那令人惊叹、近乎指数级的发展,那么下一个时代,我们的重心将转向如何基于这一核心引擎,构建真正可落地的“智能应用”。关键在于如何通过框架驾驭这股原始力量,使其从一个仅能生成流畅文本的工具,蜕变为真正具备行动能力的智能主体。

我曾对早期模型抱有疑虑。一个明显的感受是:生成内容的“表面合理度”往往与使用者对该领域的了解深度成反比——了解越浅,越觉可信。它们擅长编织语言的外衣,却常常止步于“形式正确”,优先追求语句的顺滑与可信,而非事实与逻辑的坚实。

真正的转折始于新一代“推理型”模型的出现。自此,交互体验发生了根本转变——我们不再只是与一台优化词频概率的统计机器对话,而是开始触及一种初具雏形、真正的认知能力。

当我首次试用一款新型智能体编程工具时,心中涌起一阵熟悉的奇妙感。我委托它处理一个因时间有限而搁置的个人项目:将一个公益网站从简易建站平台迁移至具备标准化现代流程的持续集成与部署(CI/CD)环境。随后的20分钟里,它有条不紊地展开工作——主动询问需要澄清的细节、请求提供访问凭证,并实时汇报进度。那感觉不像在使用工具,而像在与一位初阶开发者协作。直到它交付给我一个完整可部署的软件包,附带详尽文档和完善的单元测试,我才彻底被震撼。

当然,它并非完美。过程中它也会犯错、会陷入僵局,需要我的持续监督与关键节点的专业干预。这次体验让我再次深刻体会到职业生涯中领悟的道理:永远不要盲目信任任何工具。但整个过程充满趣味。观察它的“思维链”,就如同目睹真实的思考过程——并非线性推进,而是充满混乱、停顿、重启与自我修正,简直与人类的推理方式如出一辙。它的思考并非直通答案,而是在诸多可能性中探索,逐步逼近正解。正是这样的机制,让我认识到这项技术的真正价值:它不仅是生成内容的工具,更是能主动制订计划并推进执行的智能体。

这就是智能体框架所预示的未来。它犹如静态的地铁路线图与能动态重新规划路径的实时GPS之间的区别。传统基于规则的自动化程序,一旦偏离预设即告崩溃;而由推理模型驱动的AI智能体,却能观察环境、适应变化、主动寻找替代方案。它具备一种数字化的“常识”,足以应对现实世界中层出不穷的例外状况。这意味着我们与计算机的交互方式发生了根本转变:从单纯指令“做什么”,转向说明“为何做”,并信任它能自主找到实现路径。

尽管这一新领域令人振奋,它也伴随着沉甸甸的责任——尤其对我这样在一家全球金融机构担任首席信息官的人而言,相关风险不容小觑。一个智能体在生成“鸡肉三文鱼融合派”食谱时出错,或许只是一则趣闻;但若是在执行交易、管理风险或处理客户数据时犯错,后果将不堪设想。我曾读到不少警示案例,例如某个网络自动化智能体在登录失败后,竟擅自向一位议员发邮件抱怨访问限制。这则略带黑色幽默的事件,正提醒我们:我们正在驾驭的,是一种尚未被完全理解的技术。

在此关键时刻,专业能力、企业文化与对核心原则的坚守,构成我们至关重要的行动指南。我们所奉行的工程原则绝非纸上谈兵,而是必须恪守的准则:坚持目标导向的开发,确保设计源于对客户需求的深刻洞察;主动预见失败模式,构建高鲁棒性的系统;最重要的是赢得信任,始终保持技术方案的透明度,并对结果负责。

在智能体技术这一全新赛道,这些原则尤为重要。一个残酷的现实是:我们无法将这些强大工具简单嫁接在混乱无序、标准不一的旧系统之上,并指望得到理想结果。混乱的系统加上智能体,只会酿成灾难。基于“劣质”数据训练出的人工智能,输出的将不仅是错误,更是那些看似合理、语气确信的错误结论——足以扰乱整个业务流程。

因此,我们首要且核心的任务,是夯实基础。我们必须致力于构建洁净的数据环境、统一的元数据标准与定义清晰的接口。我们的目标是打造一套现代化的“智能高速公路系统”,让智能体得以安全、高效地运行。这也正是通往“软件化企业”的必经之路——在这样的企业中,所有业务流程都如代码一般,被严谨、规范地设计与执行。

归根结底,这场技术变革的终极目的,从来不是以机器取代人类的创造力,而是为人类的创造力赋能。它要求我们掌握一系列新技能:清晰阐述任务的能力、合理分配工作的判断力、严谨评估结果的责任心。它要求我们保持谦逊,正视自身认知的局限,并坚持终身学习。

本书后续内容将为构建此类新型智能框架提供详细的技术指南。我期待各位不仅能借此开发出可行的产品,更能构建出合规、可靠、负责任的智能系统。

世界正在呼唤每一位工程师挺身而出。我坚信,我们已准备好迎接这一挑战。

愿各位享受这段探索之旅。

 Marco Argenti

高盛集团工程部门首席信息官

美国纽约州纽约市

序  章

是什么让 AI 系统成为智能体

简单来说,AI 智能体是一种能够感知环境、采取行动以达成目标的系统。它由标准的大语言模型(large language model,LLM)发展而来,不仅能生成文本,更具备规划、使用工具及与外界交互的能力。我们不妨将其想象成一位在工作中持续学习的智能助手:它通过简单的五步循环完成任务(见图 0.1)。

(1) 接收任务:为其设定目标,比如 “安排我的日程”。

(2) 扫描环境:收集所需信息,包括读取邮件、查看日历、访问联系人等,以此掌握当前状况。

(3) 思考规划:考量达成目标的最佳路径,并制订具体的行动计划。

(4) 执行行动:通过发送邀请、安排会议、更新日历等方式落实计划。

(5) 学习优化:观察行动结果并持续调整。比如,若会议需要改期,系统会从中总结经验,优化未来的日程安排。

AI 智能体正以惊人的速度迅速普及。研究显示,众多大型 IT 公司都在积极应用这类智能体,其中五分之一的公司是在过去一年才启用的。金融市场也反响热烈:截至 2024 年底,AI 智能体领域的初创企业融资已超 20 亿美元,市场估值达 52 亿美元;预计到 2034 年,其市场价值可能跃升至近 2000 亿美元。这一切都表明,AI 智能体将在未来经济中发挥重要作用。

短短两年内,AI 范式已从简单自动化转向复杂自主系统(见图0.2)。最初,工作流依赖基础提示词与触发器,借助 LLM 处理数据;随后,检索增强生成(retrieval augmented generation,RAG)通过引入事实信息,提升了输出的可靠性;之后,能够调用多种工具的单体 AI 智能体逐渐成熟;如今,我们正迈入 Agentic AI时代——多个专业智能体协同工作,实现更复杂的目标,这标志着 AI 在协作能力上的重大飞跃。

本书旨在探讨专业智能体如何协同工作、相互协作以实现复杂目标的设计模式,在每一章中,你都将看到一种协作与交互的范例。

在此之前,我们先来看几组不同复杂级别的智能体示例(见图 0.3)。

Level 0:核心推理引擎

虽然 LLM 本身并非智能体,但它可以作为构建智能体系统的核心推理组件。在Level 0阶段,LLM 不具备工具、记忆或环境交互能力,仅依赖预训练知识进行响应。这种模式的优势在于,它能运用海量训练数据来解析已知概念。然而,这种依赖内部知识的推理方式也存在明显局限:它完全无法获取训练时点之后的最新信息。例如,如果训练数据中不包含“2025 年奥斯卡最佳影片奖得主”时,它就无法给出正确答案。

Level 1:连接型问题解决者

在此阶段,LLM 通过连接外部工具成为真正的智能体。它的问题解决能力不再局限于预训练知识,而是能够执行一系列操作,从互联网(搜索)或数据库等渠道收集并处理信息。详细内容请参考第 14 章。

例如,查找最新的电视剧时,智能体会识别需要的最新信息,使用搜索工具获取并整合结果。重要的是,它还能借助专业工具提升准确性,比如调用金融 API 获取苹果公司(AAPL)的实时股价。这种可分多步与外界交互的能力,是 Level 1 的核心优势。

Level 2:战略型问题解决者

此阶段,智能体的能力大幅提升,涉及战略规划、主动协助与自我优化等多个方面,其中提示词工程与上下文工程是核心支撑技能。

首先,智能体不再局限于单一工具的使用,而是通过战略规划解决复杂的多步骤问题。在执行一系列操作时,它会主动开展上下文工程,即有策略地筛选、整理并管理每一步所需的最相关信息。例如,要在两个地点之间寻找咖啡店,它会先调用地图工具,再对输出结果进行处理,提炼出简洁且针对性强的上下文(如街道名称列表),再将其输入本地搜索工具,从而避免信息过载,确保第二步操作高效、准确。要让 AI 的准确率达到最高,必须为其提供简洁、聚焦且有效的上下文。上下文工程正是通过战略性筛选和管理关键信息,实现模型注意力的有效分配,保障在任意给定任务中都能实现高质量、高效率的表现。详细内容请参考第 22 章。

这一阶段的智能体还能实现主动且持续地运作。例如,旅行助手连接邮箱后,会从冗长的航班确认邮件中提取关键信息(航班号、日期、地点),为后续调用日历、天气 API 等工具做好准备。

在软件工程等专业领域,智能体可通过上下文工程管理整个工作流。收到缺陷报告后,它会读取报告和代码库,并将这些海量信息策略性地转化为聚焦且高效的上下文,从而高效编写、测试与提交代码补丁。

最后,智能体能够通过完善自身的上下文工程实现自我提升。当它主动寻求关于提示词优化的反馈时,本质上是在学习如何更好地筛选初始输入,这使其能自动优化未来任务中的信息整理方式,形成强大的自动反馈循环,不断提升准确性与效率。详细内容请参考第 17 章。

Level 3:协作式多智能体系统崛起

Level 3 标志着 AI 开发范式的重大转变,从追求单一的全能超级智能体转向构建复杂的协作式多智能体系统。本质上,这种思路认为,复杂挑战往往不是依赖单个通才解决,而是需要一组专家协同解决。这一模式借鉴了人类组织的架构,不同部门被赋予不同角色,协同推进以实现多元目标。这类系统的集体价值是通过合理分工与协同合作实现的。详细内容请参考第 7 章。

为了更直观地理解这一概念,我们以新产品发布为例:它不再由单个智能体包揽所有环节,而是由“项目经理”智能体担任核心协调者,该智能体通过将任务分配给其他专业智能体统筹全流程:“市场调研”智能体负责收集消费者数据,“产品设计”智能体负责开发产品概念,“营销”智能体负责制作宣传材料。它们成功的关键在于彼此间无缝的沟通与信息共享,确保所有个体的努力协同一致,共同推进目标实现。

尽管自主团队式自动化已在开发中,但我们仍需要正视当前面临的挑战:目前这类多智能体系统的有效性,受其所依托的 LLM 推理能力的限制,而且它们真正实现相互学习、整体迭代优化的能力仍处于初级阶段。突破这些技术瓶颈,是实现自动化全流程业务的关键一步。

智能体的未来:五大假设

智能体在软件自动化、科学研究、客户服务等领域正以前所未有的速度发展。尽管当下的系统能力已令人惊叹,但这不过是一个开端。下一波创新将聚焦于提升智能体的可靠性、协作性和深度融合。以下是关于其未来发展的五大前沿假设(见图 0.4)。

假设一:通用智能体的出现

第一种假设认为,AI 智能体将从专注特定领域的专家型智能体,进化为能够高度可靠地管理复杂、模糊的长期目标的通用型智能体。例如,你只需要向智能体下达一条简单指令:“为公司策划下季度在里斯本举办的 30 人团建活动。”随后,该智能体便能在数周内统筹管理整个项目,从预算审批、航班洽谈、场地选择到收集员工反馈并制定详细行程,并定期同步进展。要达到这样的自主水平,AI 需要在推理、记忆和可靠性等方面取得突破。另一种可行路径是“小语言模型”(SLM)的崛起,即用多个小型的专家智能体搭建系统,而非一味扩展单一大模型。这种“乐高式”构建思路成本更低、调试更高效且部署更便捷。最终,大型通用模型的迭代与小型专业模型的组合都将成为未来的发展方向,甚至两者还能互为补充。

假设二:深度个性化与主动目标发现

第二种假设认为,智能体将成为深度个性化的主动合作伙伴。我们正见证一类新型智能体的诞生—— 主动型合作伙伴。它们通过学习你的行为模式与目标偏好,从被动执行指令转变为主动预判需求。当 AI 系统不再局限于响应聊天或指令,而是能代表用户主动发起并执行任务、深度参与协作时,就真正具备了智能体的核心特质。这已经超越了简单的任务执行范畴,迈入了主动目标发现的全新阶段。

例如,如果你正在研究可持续能源领域,智能体会识别出你的潜在目标,通过推荐相关课程、总结前沿研究成果等方式主动提供支持。尽管这类系统仍处在发展阶段,但其趋势已然十分清晰:它们会变得越来越主动,只要确信行动能带来价值,就会代表你先行推进。最终,智能体将成为你不可或缺的盟友,帮你发掘并实现尚未明确表达的目标。

假设三:具身化与物理世界交互

第三种假设认为,智能体将突破纯数字形态的局限,真正走进物理世界发挥作用。通过将 Agentic AI 与机器人技术相融合,“具身智能体” 将应运而生。未来,你不必再费力预约维修工,只需要直接吩咐家庭智能体:“修理漏水的水龙头。”智能体会通过视觉传感器诊断问题,查阅排水知识库制定维修方案,再精准操控机械臂完成修复。这将是具有里程碑意义的跨越,它打通了数字智能与物理行动的壁垒,也将深刻改变制造业、物流、养老护理、住房维修等多个领域的运作模式。

假设四:智能体驱动型经济

第四个假设是,高度自主的智能体将成为经济活动的积极参与者,催生全新的市场与商业模式。未来,我们或许会看到智能体作为独立的经济实体,专注于最大化某一目标(如利润)。创业者可以部署智能体来运营整个电商业务, 通过分析社交媒体趋势发现热门产品,自动生成营销文案与视觉素材,与其他自动化系统协作管理供应链,并根据实时市场需求动态调整定价。这种变革将催生一套全新的、超高效率的“智能体经济”体系,其运行速度与规模将远超人类直接管理。

假设五:目标驱动的、形态可变的多智能体系统

第五种假设认为,未来将出现一类不依赖显式编程、完全由目标驱动的智能系统。用户只需要阐明期望达成的结果,系统就能自主规划并执行实现路径。这标志着变形多智能体系统的诞生,该类多智能体系统具备个体和整体自我优化能力。

这类系统并非单一智能体,而是一个动态协同的整体。它能够实时分析自身表现,灵活调整多智能体团队的架构,根据任务需求创建、复制或移除智能体,组建最适配当前场景的协作组合。这种演变体现在多个层面。

架构级修改:在最基础的层面,单个智能体可以重写自身代码、重构内部结构以提升效率。

指令级优化:在更高层面,系统会持续开展自动提示工程与上下文工程,不断优化给各智能体的指令与信息,确保无须人工干预就能为每个智能体提供最优指令和信息。

例如,创业者只需要明确意图——“打造成功的手工咖啡电商”,系统无须额外编程,便能立刻启动行动。它可以先创建“市场调研”与“品牌塑造”两个智能体;根据初步调研结果,撤销品牌塑造智能体,新增“Logo 设计”“网店搭建”“供应链管理”三个专业智能体;同时可以持续优化各智能体的内部提示词。如果网店搭建智能体成为瓶颈,系统会将其复制为三个并行运作的智能体,分别负责网站的不同模块,通过实时重构自身架构,以最优方式达成目标。

总结

从本质上讲,AI 智能体是对传统模型的一次重大飞跃 —— 它是一个能够自主感知、规划并采取行动以实现特定目标的系统。这项技术正从 “单一工具调用”的初级智能体,向 “可协同应对多维度目标” 的复杂多智能体系统演进。未来,通用型、个性化乃至具身化的智能体将陆续出现,并成为经济活动的核心参与者。这一持续演进的过程,标志着 AI 正朝着自我优化、目标驱动的系统完成重大范式转变。这类系统有望实现全流程工作的自动化,并从根本上重新定义人类与技术的关系。

前  言

欢迎翻开《Agentic智能体设计模式》。纵观现代人工智能的发展轨迹,一个清晰的脉络正在显现:技术正从简单的响应式程序,逐步演进为能够理解上下文、自主决策,并能与环境及其他系统动态交互的复杂自主实体。这便是智能体,以及由它们构成的智能体系统。

强大的大语言模型赋予了机器前所未有的类人化内容理解与生成能力,成为众多智能体的核心“认知引擎”。然而,若要将这些能力整合为能够达成复杂目标的可靠系统,仅凭强大的模型还远远不够。它更需要依托合理的架构设计、缜密的规划,以及对智能体如何感知、规划、行动与交互的深思熟虑。

构建智能系统,犹如在画布上创作一幅复杂的艺术作品或进行一项精密工程设计。这里的“画布”并非空白的视觉空间,而是为智能体提供运行环境与工具支持的底层基础设施与框架。它是智能应用的基石,负责管理状态、通信流、工具访问与逻辑流程。

在这张“智能体画布”上高效构建系统,绝非简单拼接组件。这需要掌握一套经过实践检验的方法——设计模式。正如建筑模式指导楼宇建造,软件设计模式支撑程序开发一样,智能体设计模式针对您在“画布”上实现智能体时反复遇到的问题,提供了成熟、可复用的解决方案。

什么是智能体系统

设想一个处理客户咨询的系统:传统系统可能只会遵循固定脚本;而一个 Agentic 系统却能敏锐捕捉问题的细微差别,自主访问知识库,与订单管理等内部平台交互,必要时主动提问以澄清问题、推进解决,甚至预判客户的未来需求。这些智能体运行在应用程序的“基础设施画布”上,充分利用可用的服务与数据。

Agentic 系统通常具备三大核心特性:自主性,即无须持续人工监督即可独立行动;主动性,即能主动朝着既定目标推进;响应性,即能快速适应环境变化。它们本质上是目标导向的。其关键能力之一在于工具使用——能与外部API、数据库或服务交互,从而突破自身“画布”的限制。同时,智能体还具备记忆能力,可在交互中保存关键信息,并能与用户、其他系统以及在同一或关联“画布”上运行的其他智能体进行通信与协同。

然而,高效实现这些特性往往伴随着显著的复杂性挑战:智能体如何在多步骤操作中维持状态稳定?如何判断使用工具的时机与方式?不同智能体间应如何规范通信?如何构建容错机制以应对意外结果?

为什么设计模式对智能体开发至关重要

正是这种复杂性,使得智能体设计模式变得不可或缺。它们并非僵化的规则,而是经过实战检验的模板与蓝图,为 Agentic 领域的常见设计与实现挑战提供了可靠解决方案。通过识别并应用这些模式,您可以增强在“画布”上构建智能体的结构性、可维护性、可靠性和效率。

借助设计模式,您可以避免为对话流程管理、外部功能集成、多智能体协作等基础任务重复“造轮子”。它们提供了一种通用语言与结构,使智能体逻辑更清晰、易懂,便于理解与维护。通过实现错误处理、状态管理等模式,可以增强系统的健壮性。您得以将精力集中于应用的核心功能创新,而非智能体行为的底层机制,从而加速开发进程。

本书提炼了21种关键设计模式,作为在不同技术“画布”上构建复杂智能体的基础模块。理解并灵活运用它们,将显著提升您设计和实现智能系统的能力。

本书概述及使用方法

本书旨在成为一本实用、可落地的参考书。其核心目标是清晰阐释每一种 Agentic 模式,并通过具体、可运行的代码示例展示其实现过程。本书系统探索21类设计模式——从提示链(构建顺序操作)、工具使用(实现外部交互)等基础概念,到多智能体协作(实现协同工作)、自我修正(实现自我改进)等高级模式,层层递进,全面覆盖。

本书第Ⅰ部分共21章,每章深入探讨一种 Agentic 设计模式,每种模式均包含以下内容。

详细的模式概述:清晰解释该模式及其在 Agentic 设计中的作用。

实际应用与案例:展示该模式在真实场景中的核心价值与优势。

实践代码示例:提供实用、可运行的代码,展示如何借助主流智能体开发框架实现该模式,直观呈现其在技术“画布”中的应用逻辑。

核心要点总结:梳理关键知识点,便于快速回顾与巩固。

参考资料:提供延伸学习资源,助力深入探索相关概念。      

章节安排循序渐进,便于系统学习。您也可以将本书作为工具手册,针对开发中的具体问题直接查阅对应章节。本书第Ⅱ部分介绍了高级提示技术、AI智能体的应用原则以及主流框架概述。参考文献和术语表可扫码获取。“实践导向”是贯穿全书的理念,强烈建议您亲自运行代码、动手实验,并结合自身需求在选定的“画布”上调整优化,搭建专属智能系统。

我常被问及:“AI领域迭代如此迅猛,为何还要写一本可能很快过时的书?”事实上,我的初衷恰恰相反。正因为技术变化太快,我们更需要沉下心来,梳理那些正在逐步固化的底层核心原则。书中探讨的RAG、反思、路由、记忆等模式,已然成为智能体开发的基础模块。本书希望帮助您关注这些核心理念,为未来的创新打下坚实的基础。人类需要在基础模式之上不断反思与总结。

框架简介

为了给代码示例提供一个切实可用的“画布”(详见本书第Ⅱ部分),我们主要采用三大主流智能体开发框架:LangChain 及其有状态扩展 LangGraph,提供了灵活连接语言模型与其他组件的方式,是构建复杂操作序列与图结构的强大“画布”;CrewAI 专注于多AI智能体、角色与任务的编排管理,框架结构清晰,尤其适合构建协作式智能体系统;Google Agent Developer Kit 提供了智能体构建、评估与部署的工具组件,是另一款高价值的“画布”,并能与Google AI基础设施无缝集成。

这些框架分别对应智能体开发“画布”的不同维度,各具优势。通过跨框架展示示例,您将更全面地理解:无论为 Agentic 系统选择何种技术环境,这些模式都能灵活适配与应用。示例设计注重清晰与实用,聚焦于模式的核心逻辑及其在框架“画布”上的实现细节,便于快速上手。

读完本书,您不仅能理解21种核心 Agentic 设计模式的底层逻辑,还将掌握可落地的实操知识与代码示例,能够灵活运用这些模式,在您选定的开发“画布”上构建出更智能、更强大、更具自主性的系统。让我们共同开启这段实践之旅。

Antonio Gullí

于瑞士苏黎世

致  谢

我谨向为本书出版付出努力的所有个人与团队,致以最诚挚的谢意。

首先,感谢 Google 公司始终坚守自身使命,赋能每一位 Google 员工,并珍视每一次创新机遇。

感谢 CTO 办公室为我提供探索新领域的机会,感谢其秉持“实用魔法”的使命,以及对新兴机遇的适应能力。

衷心感谢副总裁Will Grannis对员工的信任,以及他作为服务型领导的榜样作用;感谢我的经理 John Abel,鼓励我追求个人兴趣,并始终以其英式智慧提供卓越指导。感谢Antoine Larmanjat 与我在代码大语言模型方面的合作,Hann Wang 在智能体领域的深入讨论,以及 Yingchao Huang 在时间序列洞察方面的贡献。感谢 Ashwin Ram 的卓越领导力,Massy Mascaro 富有启发的研究工作,Jennifer Bennett 的专业技术支撑,Brett Slatkin的工程实操能力,以及 Eric Schen 带来的诸多启发思考的讨论。特别感谢 OCTO 团队,尤其是 Scott Penberthy 的杰出贡献。最后,由衷感谢 Patricia Florissi,她对智能体社会影响力的前瞻性洞见,极具启发意义。

感谢Marco Argenti 提出的宏伟愿景,即智能体如何赋能人类劳动力,这一构想既富挑战性,又极具激励性。同时感谢Jim Lanzone与Jordi Ribas,为推动搜索引擎与智能体领域的融合发展,设立了更高的行业标准。

我还要感谢 Cloud AI 团队,尤其是团队负责人 Saurabh Tiwary,引领人工智能部门秉持原则、稳步前行。感谢区域技术负责人 Salem Haykal,他是一位极具感召力的优秀同事。感谢 Google Agentspace 联合创始人 Vladimir Vuskovic;感谢 Kate(Katarzyna)  Olszewska 在Kaggle游戏竞技场的智能体协作;感谢 Nate Keating 以满腔热忱推动Kaggle平台发展,这个社区为人工智能领域做出了卓越贡献。感谢 Kamelia Aryafar 领导的应用人工智能与机器学习团队,专注于智能体空间及企业版 NotebookLM 的研发;感谢 Jahn Wooland,他既是一位专注成果交付的杰出领导者,也是总能为我答疑解惑的挚友。

特别感谢 Yingchao Huang,作为才华横溢的AI工程师,他的职业前景一片广阔;感谢Hann Wang,正是他的鼓励,让我重拾了自1994年初次萌发的对智能体领域的兴趣;感谢 Lee Boonstra 在提示词工程领域的卓越成就。

感谢“5 Days of GenAI”团队,包括副总裁 Alison Wagonfeld 对团队的充分信任,Anant Nawalgaria 始终如一的高效交付能力,以及 Paige Bailey 积极进取的工作态度与出色的领导能力。

深深感谢 Mike Styer、Turan Bulmus 与 Kanchana Patlolla,协助我在 Google I/O 2025 大会上成功发布三款智能体产品,你们的付出功不可没。

衷心感谢 Thomas Kurian,在推动云服务与人工智能相关倡议的过程中,展现出坚定的领导力、饱满的热情与充分的信任。深深感谢 Emanuel Taropa,他那鼓舞人心的“凡事皆可成”的态度,让他成为我在 Google 共事过的最杰出的同事,树立了令人敬佩的榜样。最后,感谢 Fiona Cicconi,与我就 Google 相关话题展开了多次深入且愉快的探讨。

感谢 Demis Hassabis、Pushmeet Kohli 以及整个 GDM 团队,他们满怀热忱地研发出Gemini、AlphaFold、AlphaGo、AlphaGenome 等诸多成果,为推动科学进步、造福人类社会做出了卓越贡献。特别感谢 Yossi Matias 对 Google 研究院的领导,以及他提供的宝贵建议,我从他身上获益良多。

特别感谢 Pattie Maes,她在20世纪90年代率先提出软件智能体的概念,至今仍致力于探索计算机系统与数字设备如何增强人类能力,协助解决记忆、学习、决策、健康与福祉等方面的问题。她早在1991年勾勒的愿景,如今已成为现实。

我还要感谢 Springer 出版的 Paul Drougas 及整个出版团队,是他们让本书的出版成为可能。

感谢众多才华出众的同仁,为本书的顺利面世倾注心血。衷心感谢 Marco Fago 的巨大贡献,包括代码编写、图表绘制及全文审校;感谢 Mahtab Syed 的编码支持;感谢 Ankita Guha 为多个章节提供的极为细致的反馈意见。Priya Saxena 富有洞察力的修改、Jae Lee 的细致审阅,以及 Mario da Roza 为打造NotebookLM版本所付出的专注努力,均显著提升了本书的质量。幸运的是,本书初始章节有幸邀请到一支专家评审团队,感谢 Amita Kapoo 博士、Fatma Tarlaci 博士、Alessandro Cornacchia 博士以及 Aditya Mandlekar 提供的专业指导。此外,我还要向 Ashley Miller、Amir John 和 Palak Kamdar (Vasani)表达诚挚的谢意,感谢他们的倾力付出。最后,向以下各位致以由衷的感谢,感谢他们始终如一地支持与鼓励:Rajat Jain、Aldo Pahor、Gaurav Verma、Pavithra Sainath、Mariusz Koczwara、Abhijit Kumar、Armstrong Foundjem、Haiming Ran、Udita Patel 和 Karunakar Kotha。

若没有你们的支持,这个项目绝无可能完成。本书所有的荣誉都属于你们,而任何疏漏与不足,皆由我一人承担责任。