10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

微软开源 SkillOpt:让 AI Agent 的 Skill 自动优化迭代

2小时前 AI开源项目 10 0

为什么你的 AI Agent 总是不听话?

做 AI Agent 开发的人大概都经历过这种场景:Agent 跑偏了,于是跑到 Skill 文件里加一句「别这么做」。结果格式不对,又补一句「输出应该长什么样」。改着改着,Skill 文件越来越长,Agent 却越来越笨。

问题可能不在模型够不够聪明,而在 Skill 写得够不够好。

微软最近开源的 SkillOpt,提供了一条全新的解决思路——把 Skill 本身变成一个能自动优化、反复迭代的东西。

图片 1

SkillOpt 的工作原理

SkillOpt 的核心设计是让两个模型搭班子协作:

  • 执行模型:按照当前 Skill 完成一批任务,记录哪些做成了、哪些搞砸了
  • 优化模型:复盘执行结果,成功则吸取经验,失败则寻找规律,判断是否在同一个地方反复出错

复盘完成后,优化模型开始动手修改 Skill 文件——增删内容或调整描述。但每次改动都有严格限制,只允许小改几处(论文测试表明控制在 4 处左右效果最佳),防止步子太大把原本好用的规则也改坏了。

经过多轮迭代后,真正被保留下来的核心规则往往只有两三句。这才是 Skill 的精华。

图片 2

验证机制:改得好才保留

SkillOpt 不是盲目修改。每次改动后,都会用一批新任务来验证效果:

  • 结果变好 → 保留改动
  • 结果没变好 → 回退到上一版本

被回退的改动也不会白费,系统会将其存入「失败记录」档案。后续优化时就知道哪些路走不通,避免在原地打转。

每跑完一整轮,框架还会做一次全局复盘,重新审视整份 Skill,防止越跑越偏。

图片 3

实测效果:覆盖 6 类任务,52 次测试全部第一

论文中给出了详细的测试数据。SkillOpt 在 6 类任务场景、7 个不同模型上进行了 52 次测试,全部拿到第一或并列第一:

任务类型 覆盖场景
查资料答题 信息检索、知识问答
表格处理 数据整理、格式转换
文档解读 长文摘要、关键信息提取
数学解题 逻辑推理、公式推导

以 GPT-5.5 为例,使用 SkillOpt 优化后的 Skill,平均分数提升了 23.5 分,其中表格类任务提升接近 39 分。关键点是——这些提升完全是在不修改模型本身的前提下获得的。

图片 4

苏米注:这个结果说明了一个常被忽略的事实——很多时候模型已经够用了,真正拉开差距的是你给它的指令质量。

如何上手使用

SkillOpt 目前还没有提供开箱即用的安装包,需要手动安装:

  1. 克隆仓库并安装:

    git clone https://github.com/microsoft/SkillOpt.git
    cd SkillOpt
    pip install -e .
  2. 配置模型 API,支持 OpenAI、Anthropic、Qwen 等主流模型

  3. 准备两份带答案的测试集——一份用于训练,一份用于验证

  4. 执行一条命令启动优化,等待 Skill 文件输出

图片 5

工具还提供了 WebUI,可以直观地观察训练过程。安装和启动命令:

pip install -e ".[webui]"
python -m skillopt_webui.app

更多参数配置和使用步骤,可以参考 GitHub README 中的详细教程。

写在最后

过去调整 Skill 全凭经验,让 AI 去改,改好了也说不出原因。SkillOpt 把这件事变成了能验证、能回退、能自我迭代的过程——每次失败都成了让 Skill 更稳的经验。

类似的思路在 Hermes Agent 身上也能看到:把重复性复杂任务写成 Skill,后续不断迭代优化。两者路径不同,但方向一致——让 Skill 自己变得更好用。

也许以后,我们真的不用再一遍遍手动打磨 Skill 了。

GitHub 项目地址:https://github.com/microsoft/SkillOpt

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:微软开源 SkillOpt:让 AI Agent 的 Skill 自动优化迭代
#SkillOpt #微软开源 #AI Agent #Skill优化 #自动迭代 
收藏 1
ECC 开源发布:AI Agent 操作系统,182K Star 打通所有 AI 编程工具
Claude Opus 4.8 发布:Dynamic Workflows 让 AI 自主编排大规模开发任务
推荐阅读
  • JCP:多Agent协作的A股智能分析系统,让AI像研究员一样讨分析股票
  • Pi-mono:四个工具的完整编程闭环,OpenClaw背后的框架
  • TuriX-CUA:让 AI 接管 Windows 和 MacOS,这个 GitHub 开源项目牛
  • Adnify:一个集聊天、任务执行、项目规划于一身的开源 AI IDE
  • Twake Drive:用 Node.js 自建私人网盘,10分钟完成部署
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
9353 7月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
8974 8月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
7088 5月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
6350 3月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
6210 8月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
6065 8月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
5934 7月前
CapCut API:一个剪映API开源项目,让AI自动剪辑视频
5586 5月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5586 9月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5501 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 微软开源 SkillOpt:让 AI Agent 的 Skill 自动优化迭代
2 ECC 开源发布:AI Agent 操作系统,182K Star 打通所有 AI 编程工具
3 开源 Skill 彻底解决小红书配图难题:11 品类适配 + 杂志风设计
4 omp 开源发布:Hashline 技术让 AI 编程编辑成功率提升 10 倍,支持 40+ 模型
5 BiliSum 开源工具:B 站、YouTube 视频自动转写,生成结构化笔记和思维导图
6 微软开源Webwright:让 LLM 直接写 Playwright 脚本,浏览器 Agent 性能达 SOTA
7 DeepSeek++ 浏览器扩展评测:工具调用、长期记忆与MCP集成,让网页版AI更强大
8 One API 自建 AI 网关:15 分钟整合所有模型 Key,告别中转站跑路风险
9 PilotDeck 开源 AI Agent 操作系统:一个人指挥一支智能体军队
10 pyVideoTrans 开源视频翻译工具:语音识别+翻译+配音+声音克隆一站式解决方案
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联