10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI学习教程

多 Agent 协调的五种模式详解:从生成 - 验证到共享状态,按需演进

2小时前 AI学习教程 12 0

摘要:Anthropic 最新博客将多 Agent 协调归纳为五种模式,从最简单到最复杂,给出了何时演进到下一级的判断标准。大部分团队的问题不是不知道多 Agent 的好处,而是上来就挑最酷的模式,结果被协调开销拖死了。


用一个 Agent 搞不定复杂任务?上多 Agent 吧。这个判断现在大家基本都认了。但上多 Agent 之后紧跟着一个更具体的问题:这些 Agent 之间怎么配合?

Anthropic 刚发的这篇博客正好补了这个缺口,把多 Agent 协调归纳成五种模式,从最简单到最复杂,还给出了什么时候该从一种演进到另一种的判断标准。

苏米注:读完最大的感受是:大部分团队的问题不是不知道多 Agent 的好处,而是上来就挑了一个听起来最酷的模式,结果被协调开销拖死了。Anthropic 的建议是,从最简单的能跑通的模式开始,看它哪里撑不住了,再往上演进。

模式一:生成 - 验证(Generator-Verifier)

这是最简单的多 Agent 模式,也是部署最广的。

Generator-Verifier 模式架构图

逻辑很简单。一个 Agent 负责生成输出,另一个负责评估。评估通过就结束,不通过就把反馈打回给生成方,重新来一轮。循环下去直到通过或者达到最大迭代次数。

最典型的应用是代码生成:一个 Agent 写代码,另一个写测试、跑测试。客服场景也适用,生成方起草邮件回复,验证方检查是否准确引用了产品文档、是否回应了用户提到的每个问题。

常见踩坑点

踩坑 1:验证标准太模糊

如果你只告诉验证方检查输出是否足够好,它大概率会糊弄人,放行所有东西。验证方的价值完全取决于你能不能把"好"拆成具体的、可检查的标准。

踩坑 2:迭代循环卡死

生成方解决不了验证方提的问题,两边来回震荡不收敛。所以必须设最大迭代次数,加一个兜底策略,比如升级给人处理,或者返回当前最好的版本并标注问题。

模式二:编排 - 子 Agent(Orchestrator-Subagent)

这是层级式的分工。一个 Agent 当 Team Lead,负责规划任务、分配工作、汇总结果。子 Agent 接到具体任务后执行完就汇报。

Orchestrator-Subagent 模式架构图

Claude Code 用的就是这个模式。主 Agent 自己写代码、编辑文件、跑命令,需要搜索大型代码库或者调查独立问题时,就在后台派 subagent 去做,自己继续手头的活。

这个模式适合任务拆分清晰、子任务之间依赖少的场景。比如自动化代码审查:一个 PR 进来,需要查安全漏洞、检查测试覆盖率、评估代码风格、验证架构一致性。每个检查维度独立、上下文不同、输出格式明确。

核心问题:信息瓶颈

当子 Agent 发现了对其他子 Agent 有用的信息时,这条信息必须经过编排 Agent 中转。安全子 Agent 发现了一个认证漏洞,这个发现影响架构子 Agent 的分析。编排 Agent 需要识别这种依赖关系并正确路由信息。经过几轮中转之后,关键细节经常被丢失或者在摘要中被省略掉。

苏米注:我在用 Claude Code 的 subagent 时也有类似体感。subagent 搜完代码库回来的结果有时候会把关键上下文压缩掉,主 Agent 拿到的是一个干净但不够完整的摘要。

模式三:Agent 团队(Agent Teams)

编排模式里的子 Agent 是用完即弃的。接到任务,干完活,交结果,走人。但如果任务需要 worker 在多轮中积累经验呢?

Agent 团队模式的区别就在这里:worker 是持久的。

Agent Teams 模式架构图

一个协调者启动多个 worker Agent 作为独立进程。领任务,干活,交结果。不重置,不遗忘。每个 worker 在多轮迭代中积累对自己负责领域的熟悉度。

最直观的例子是大规模代码迁移。每个 worker 分管一个服务,在反复处理这个服务的依赖、测试、部署配置的过程中,逐渐摸清它的脾气。一次性 subagent 每次接手都要重新理解服务的配置约定和依赖关系,持久 worker 第一次弄明白之后后续迭代直接复用,省掉重复的上下文加载。

硬前提:独立性

团队模式里的 worker 没有中间人帮忙传话。一个 worker 的改动影响了另一个,谁都不知道,产出可能冲突。常见的应对方式是文件级别的分区或者合并前跑冲突检测,但这增加了协调者的复杂度。

模式四:消息总线(Message Bus)

前面三种模式都有明确的协调者在指挥交通。但如果 Agent 数量继续增加、交互模式变得不可预测呢?

Message Bus 模式架构图

消息总线引入了一个共享通信层。核心操作就两个:发布和订阅。Agent 订阅自己关心的 topic,路由器负责分发。新 Agent 上线不需要改已有的连接,订阅相关 topic 就能开始接收工作。

Anthropic 举的例子是安全运维自动化。告警从多个来源进来,分诊 Agent 分类后路由给对应的调查 Agent,调查结果再流向响应协调 Agent。事件一个阶段接一个阶段地流下去,新出了什么威胁类型就加个新 Agent,各个 Agent 还能独立开发部署。

代价:可追溯性变差

一个告警触发五个 Agent 之间的事件级联,要搞清楚到底发生了什么,调试难度比编排模式那种顺序决策链高了不少。路由器分错类或者丢了事件更麻烦,系统会静默失败,什么都不处理但也不崩溃。

模式五:共享状态(Shared State)

前四种模式里都有一个中心角色在管理信息流。共享状态模式把这个中间人去掉了。

Shared State 模式架构图

没有中央协调者。Agent 自主运行,读写一个共享的数据库、文件系统或文档。工作一般从往存储里丢一个问题或数据集开始。停下来的条件有几种:时间到了、结果收敛了,或者有个专门的 Agent 判断存储里的东西已经够用了。

研究综合场景是这个模式的主场。多个 Agent 分头调查一个复杂问题的不同方面,学术 Agent 发现了一个关键研究者,这条信息对行业 Agent 调查这个研究者的公司立刻就有用。不用等协调者来路由,发现直接写进存储,其他 Agent 马上就能看到。

代价与挑战

Agent 可能重复工作或者走互相矛盾的方向。更棘手的是反应式循环:Agent A 写了一个发现,Agent B 读到后写了跟进,Agent A 看到跟进后又回应。系统持续烧 token 但不收敛。

五种模式对比总结

模式 复杂度 适用场景 主要挑战
生成 - 验证 ⭐ 代码生成、客服回复 验证标准模糊、迭代卡死
编排 - 子 Agent ⭐⭐ 任务拆分清晰、子任务独立 信息瓶颈、上下文丢失
Agent 团队 ⭐⭐⭐ 需要积累经验的长期任务 worker 独立性、冲突检测
消息总线 ⭐⭐⭐⭐ 大规模 Agent 协作、事件驱动 可追溯性差、静默失败
共享状态 ⭐⭐⭐⭐⭐ 研究综合、复杂问题调查 重复工作、反应式循环

苏米的实践建议

演进原则:从最简单的能跑通的模式开始,看它哪里撑不住了,再往上演进。不要上来就选最复杂的模式。

对于大多数团队,我建议从生成 - 验证模式开始,这是最简单且部署最广的模式。当你的任务需要拆分成多个独立子任务时,再考虑演进到编排 - 子 Agent模式。

如果你的子 Agent 需要在多轮中积累经验,再考虑Agent 团队模式。只有当 Agent 数量继续增加、交互模式变得不可预测时,才需要考虑消息总线或共享状态模式。

模式演进路径图


文章来源:Feisky

原文编译自 Anthropic 博客《Multi-agent coordination patterns: Five approaches and when to use them》

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:多 Agent 协调的五种模式详解:从生成 - 验证到共享状态,按需演进
#Anthropic #多Agent 
收藏 1
蚂蚁集团开源 6 大可视化 Skill,Claude Code 画图能力大升级
Anthropic Agent 三件套全面解读:Claude Code、Cowork、Managed Agents 定位与使用场景详解
推荐阅读
  • 3分钟搭建AI办公助理:用飞书CLI+OpenClaw打造自动化工作流
  • 好玩AI:我用秒哒,零代码开发两款爆火Nano Banana图片生成AI应用
  • 手把手教你开通:如何1美元解锁ChatGPT Team团队版(附取消订阅指南)
  • 如何在腾讯云用79元搞定OpenClaw“云养虾”,别花冤枉钱!
  • 手把手教你在树莓派上部署n8n,一款便携式AI工作流硬件就此诞生!
评论 (0)
请登录后发表评论
分类精选
Cursor永久免费攻略:无限邮箱注册+重置机器码+Cursor试用期重置工具实现永久免费使用
46198 1年前
手把手教你如何使用扣子Coze搭建“文生图” AI Bot
19242 1年前
n8n新手入门指南:5 分钟本地部署 + 中文汉化 + 快速启动,玩转工作流(Docker版)
18105 10月前
安装字节Trae登录提示App Unavailable(应用程序不可用)解决办法,这份官方指南请收好!
17465 1年前
Gemini CLI 装好了,登录异常怎么办?手把手教你解决 Gemini CLI 登录问题
14405 9月前
零基础上手 VSCode + Claude Code + GLM-4.6 保姆级安装配置教程
14246 6月前
一文搞懂什么是 Vibe Coding?Vibe Coding工具推荐及Cursor编程开发实践
14064 11月前
AI 概念篇:Token是什么?一文讲清楚Token分词、窗口、计费与常用计算工具
13308 4月前
手把手教你使用 Gemini 2.5 Pro 免费 API搭建本地知识库,一键接入 Gemini!
13029 9月前
手把手教你快速入门OpenCode + GLM-4.7 + Oh-My-Opencode + Skills 安装配置与高效使用指南
11582 3月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 WorkBuddy 进阶:别再用默认模型了!切换 GLM-5.1 后我的工作效率翻了 3 倍
2 多 Agent 协调的五种模式详解:从生成 - 验证到共享状态,按需演进
3 用 WorkBuddy 做 Prompt(提示词)进阶:20 个模板覆盖高频职场场景
4 WorkBuddy 内置的各个模型详解 | 侧重点 + 积分消耗 + 应用举例一次看懂!
5 WorkBuddy 避坑指南:4 个常见陷阱与解决方案
6 WorkBuddy 个人知识库搭建指南:5 步打造你的 AI 第二大脑
7 WorkBuddy 积分节省指南:5 个技巧让 Token 消耗降低 90%
8 手把手教你安装 Hermes Agent,接入OpenRouter 免费模型,IM消息集成
9 MiniMax M2.7 接入 WorkBuddy 完整教程:5 分钟配置,204K 上下文实测
10 WorkBuddy 比价实测:3 分钟搞定 2 小时的比价任务
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联