10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Anthropic 实操指南:如何为 Agent 设计工具

2小时前 AI最新动态 10 0

出处说明:本文译自 Anthropic 官方博客《Seeing like an agent: how we design tools in Claude Code》,作者 Thariq Shihipar(Claude Code 团队工程师)。原文于发布当日上线。为便于国内读者理解,以下在不改变核心信息的前提下对原文进行了重写与编排。

把自己“调到”模型视角:工具要贴合能力

在构建 Agent 时,最难啃的骨头之一是“工具设计”。Claude 的行为完全通过工具调用完成,而在 Claude API 中,工具可以用 bash、skills、代码执行等原语拼装出来。那么,该给 Agent 一把“通用瑞士军刀”(如 bash/代码执行),还是塞给它一箩筐细分工具?

一个好用的思考框架是:换位到模型角度。就像解一道难题——只给纸笔能做,但慢;有计算器更快,但要会用高级功能;电脑最强,但前提是会写并运行代码。给 Agent 的工具,应该与它的能力“形状”契合。

怎么判断模型的能力边界?观察、阅读输出、反复实验,学会“像 Agent 一样看”。如果你也在做 Agent,你会遇到同样的问题:何时加工具、何时撤工具、如何分辨二者。下面是我们打造 Claude Code 的亲身实践(包含走过的弯路)。

案例一:用 AskUserQuestion,系统化提升提问(elicitation)

目标很明确:提升 Claude 向用户提问的质量与效率。如果只用纯文本提问,用户答复常常感觉“费劲”。

我们尝试过三种方案:

尝试 1:在 ExitPlanTool 上“叠加参数”

我们给 ExitPlanTool 增加了一个问题数组参数,让它在生成计划的同时列出要问的问题。这是最省事的改法,却立刻引发混乱:计划与问题共存时,若用户回答与计划冲突怎么办?是否需要二次调用?这条路走不通。

尝试 2:规定输出格式(特制 Markdown)

我们把输出指令改成“结构化问询格式”,例如用项目符号列问题,选项放在方括号里,前端再解析成 UI。Claude 大多数时候能遵守,但并不稳定:偶尔多加句子、漏掉选项,甚至完全丢弃格式。

尝试 3:独立工具 AskUserQuestion

最终我们做了一个独立工具,让 Claude 可在任意时刻调用(尤其在规划阶段会被特别引导)。工具触发后,前端弹出模态框展示问题,并暂停 Agent 循环直至用户答复。

  • 优点 1:可稳态地产出结构化问题,并引导提供多个选项。
  • 优点 2:具备可组合性,可在 Agent SDK 或 Skills 中复用。
  • 关键点:Claude“愿意且会用”。设计再妙,模型不理解调用方式也白搭。

这是否是 Claude Code 中 elicitation 的终局形态?未必。随着 Claude 能力增强,服务它的工具也必须迭代。下一节就是一个“曾经有用、后来碍手碍脚”的例子。

案例二:能力进化倒逼工具重构——从 Todos 到 Tasks

Claude Code 刚上线时,模型需要一个“待办清单”来保持专注。我们用 TodoWrite 写/改 Todos,并展示给用户。即便如此,Claude 仍常忘目标,我们只好每 5 轮插入一次系统提醒。

随着模型进步,“Todo 思维”开始桎梏模型:系统提醒让 Claude 误以为必须墨守清单,不敢机动调整路线。同时,Opus 4.5 擅长使用子 Agent,但多个子 Agent 如何共享同一 Todo 清单?

于是我们把 TodoWrite 升级为 Task 工具:从“盯住一条线性清单”变为“服务多 Agent 的协作任务图”。Tasks 支持依赖关系、跨子 Agent 同步状态,并允许动态修改或删除。

方法论上的启示是:模型能力上台阶后,过去“必需”的工具可能变成掣肘。要定期回溯:这些工具是否仍然必要?同时,尽量聚焦少数能力相近的模型,便于统一工具设计。

案例三:把“找上下文”的权力还给模型——从 RAG 到 Grep,再到渐进式披露

内测版 Claude Code 最初采用 RAG:用向量数据库预索引代码库,每次回复前检索相关片段塞给 Claude。RAG 又快又强,但依赖索引与环境配置,且最根本的问题是:上下文是“喂给”模型的。

如果 Claude 能搜网页,为什么不能搜代码库?我们加了一个 Grep 工具,让它自己搜索文件、自己拼上下文。随着 Claude 变聪明,“自建上下文”的效果也越来越好。

引入 Agent Skills 后,我们把这个思路正规化为“渐进式披露”(progressive disclosure):通过可递归的 Skill 文件,让模型探索并逐步发现关联上下文。常见用法是用 Skills 增配“搜索能力”,比如说明如何调用某 API、查询某数据库。

在过去一年里,Claude 从几乎不会自建上下文,进化到可以跨多层文件做嵌套搜索,精准定位所需信息。如今,渐进式披露已成为我们“在不增加新工具的前提下加功能”的常用手段。

案例四:用子 Agent 做渐进披露——Claude Code Guide

Claude Code 目前大约有 20 个工具。我们经常复盘是否真的“每一个都不可或缺”。添加新工具的门槛很高,因为每多一个工具,就多一个分支要思考。

例如,我们发现 Claude 对“Claude Code 自身”了解不够:问它怎么加 MCP、某个斜杠命令做什么,常答不上来。把所有说明塞进系统提示?用户其实不常问这类问题,强塞只会让上下文“腐蚀”,干扰它写代码的主业。

我们先试了渐进式披露:给一条文档链接,让 Claude 需要时自查。能用,但它经常把整段文档拉进上下文,只为回答一个一句话就能解决的问题。

最终方案是“Claude Code Guide”子 Agent:用户一问 Claude Code 自身的事,主 Agent 就把请求转给子 Agent。子 Agent 在自己的上下文里检索文档、按既定策略搜索与提取,只把答案回传,主 Agent 的上下文保持干净。

这仍非完美(例如在自我配置上仍可能混淆),但我们在不新增工具的前提下,把行动空间扩展开了。

方法论:像 Agent 一样看,是门手艺

给模型设计工具,既是科学,也是手艺。它高度依赖所用模型、Agent 目标与运行环境。我们的经验之谈:

  • 多做实验,勤读输出,勇于尝试新思路。
  • 工具要与模型能力匹配,既不过度“通用”,也不无谓“细分”。
  • 能力进化要同步工具升级,必要时果断“减法”。
  • 优先用渐进式披露与子 Agent 扩展能力,减少工具数量与上下文污染。

最重要的是,学会“像 Agent 一样看”。


原文:https://claude.com/blog/seeing-like-an-agent

作者:Thariq Shihipar,Anthropic 工程师,Claude Code 团队

文中涉及工具与名词:AskUserQuestion、ExitPlanTool、TodoWrite、Task、Grep、Agent Skills、Claude Code Guide、MCP、Opus 4.5 等。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Anthropic 实操指南:如何为 Agent 设计工具
#Anthropic #实操指南 #Todo #Tasks 
收藏 1
使用 skill-creator 打造专属工作流技能包
MiniMax M2.7 接入 WorkBuddy 完整教程:5 分钟配置,204K 上下文实测
推荐阅读
  • 字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
  • 谷歌领跑 AI 视频生成赛道:抢先 OpenAI Sora 推出 Veo 模型,可生成 1080P 高清视频
  • 智谱GLM-4.6 发布,国产最强模型上新,而且开源!
  • LiblibAI 上线 Z-Image Turbo 模型!
  • 智谱发布 ZCode 编辑器:Claude Code、Codex、Gemini顶级AI编程无缝切换的可视化Agent
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
27655 9月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
25594 11月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
17340 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
17078 11月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15200 1年前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13755 12月前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13657 11月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
13522 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
12247 9月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
11460 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Anthropic 实操指南:如何为 Agent 设计工具
2 OpenAI:AGI 时代的产业政策如何设计(白皮书全译与全新表述)
3 Meta 发布全新大模型 Muse Spark:多模态是强项,编程是短板
4 Anthropic 疯狂一周:四天四连发,从封杀到自建生态
5 Claude 军师模式:Opus 幕后指导,成本降 11.9%
6 28 个 OpenRouter 免费 AI 模型 API 汇总:无需信用卡即可使用
7 Codex 插件系统详解:将 Skills、应用集成与 MCP 打包成可复用工作流
8 Gemma 4 开源实测:31B 参数跻身全球前三,oMLX + Mac Mini 打造高性价比 AI 底座
9 GLM-5.1 代码能力实测:SWE-Bench Pro 全球第一,长程任务可连续工作 8 小时
10 DeepSeek 网页版灰度测试双模式:快速模式基于 3.2,专家模式或为 V4 早期版本
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联