10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI最新动态

Claude Code的Harness Engineering公开后,全世界的 Agent 能力提高了一个档次

2小时前 AI最新动态 10 0

安全研究员 Chaofan Shou 发现 Anthropic 发布在 npm 上的 Claude Code 包里,有一个 57MB 的 .map 文件没被排除。

通过这个文件可以还原出全部 1,906 个 TypeScript 源文件,512,000 行代码。

泄漏原因很低级——Bun 打包器默认生成 source map,.npmignore 没加排除规则。

更讽刺的是,源码里有一个叫 Undercover Mode 的子系统,专门防止 AI 在 git commit 里泄漏内部代号。

苏米注:这篇文章不聊八卦,聊聊这 51 万行代码里藏着什么值得学的工程设计,以及泄漏之后 24 小时内全球开发者造出了什么。

51 万行代码到底在干什么

没有一行在训练模型,全部都是 Harness Engineering:工具系统、权限管控、记忆整理、上下文压缩、多 Agent 协调、遥测监控。模型只是一个 API 调用。

ShareAI Lab 的逆向工程团队总结了一句话:模型是大脑,Harness 是身体。没有身体,大脑什么也做不了。

图片

6 个值得学的工程决策

1. 被禁用的工具,连 Schema 都不发给模型

Claude Code 里约 40 个工具,29,000 行定义代码。被拒绝的工具,模型的工具列表里看不到,自然不会去调用。

苏米注:我之前搭 OpenClaw 的 agent,在 prompt 里写了一堆「不可以调用 XX 工具」,模型照调不误。改成不注册 Schema 之后,幻觉调用直接没了。

2. 上下文用到 92% 自动压缩

压缩比 6.8 倍,语义损失不超过 3%。150K token 压到 25K。有六种不同的压缩策略,根据 session 状态动态选择。

上下文管理不是优化项,是架构决策。

3. Agent 会自己做梦

后台有个服务叫 autoDream。触发条件:距上次 Dream 超过 24 小时 + 至少 5 个新 session + 获取排他锁。触发后执行四个阶段:感知、采集、整合、修剪。这个 Dream 子 Agent 只有只读权限。

大多数 Agent 的记忆就是把对话存档。Claude Code 的记忆是会自己整理笔记的。

4. 文件编辑不用 diff,用字符串替换

FileEditTool 接受 old_string 和 new_string。不用 unified diff,不用行号。让 LLM 生成合法 diff 太容易出错。字符串替换更不容易出错,在 Agent 工程里可靠性永远排在优雅前面。

5. 系统提示词切成静态和动态两段

静态段命中 API prompt cache 不花钱。动态段根据项目变化。一刀切两段,成本直接降下来。

6. 多 Agent 协调要防偷懒

Coordinator 的 prompt 里写死了一条规则:Do NOT say 'based on your findings' — read the actual findings and specify exactly what to do.

图片

踩坑记录:我之前搭多 Agent 系统踩过完全一样的坑。主 Agent 指令太模糊,子 Agent 输出一堆无关内容,最后质量还不如单 Agent。

Claude Code vs Codex 核心分歧

维度 Codex Claude Code
安全层级 操作系统内核层 应用层
沙箱技术 Seatbelt、Landlock、seccomp 17 个生命周期钩子,6 层安全门控
粒度 粗,逃逸难度极高 细,可编程性强
运行环境 云端容器 用户进程共享边界

Codex 选了绝对隔离,Claude Code 选了精细控制。

图片

泄漏之后 24 小时,全球开发者造了什么

截至今天,GitHub 上标记 claude-code 的仓库超过 14,691 个。覆盖 Python、TypeScript、Shell、JavaScript、Go、Rust 六种语言。

图片

一、洁净室重写:四种语言,不到 24 小时

claw-code(Python + Rust):2 小时内拿了 50,000 stars,24 小时内突破 100,000 stars。GitHub 历史上增长最快的仓库。创建者 Sigrid Jin 是 Claude Code 最活跃的用户之一,一年消耗了 250 亿 token。

Kuberwastaken/claude-code(Rust):方法更严谨,一个 AI Agent 分析源码产出行为规格,另一个 Agent 仅根据规格实现。

opensolon/soloncode(Java):Gitee 上的 Java 实现,面向中国企业开发者生态。

二、教学项目:把架构变成课程

learn-claude-code(46,200 stars):副标题「Bash is all you need」。12 个课时,每个课时逆向工程一个机制:Agent 循环、工具使用、子 Agent 生成、技能加载、上下文压缩、任务系统、后台任务、Agent 团队、自主 Agent、worktree 隔离。

核心理念:模型就是 Agent,代码就是 Harness。Build great harnesses, not just great models.

总结

源码本身会过时,但它催生的开源生态不会。这次泄漏事件真正改变的是 Agent 开发格局——让更多人理解了 Harness Engineering 的重要性。

最佳实践:不要只关注模型能力,更要关注如何构建可靠的 Harness 系统。工具设计、上下文管理、多 Agent 协调,这些工程决策才是决定 Agent 能力的关键。

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Claude Code的Harness Engineering公开后,全世界的 Agent 能力提高了一个档次
#Claude Code #Agent 工程 #源码泄漏 #Harness Engineering 
收藏 1
OpenClaw 官方在 X 平台正式宣布:旗下技能市场 ClawHub 推出中国官方镜像站,附中文界面,国内访问不再受限
这是最后一篇
推荐阅读
  • Cursor已死?Claude Code 的 L4 Agent 已来!Anthropic正在用大模型降维打击AI编程
  • V0 模型接入 Cursor,AI UI 生成进入高能状态,UI + 编程要来了!
  • FLUX.2 发布:多参考一致性和文本渲染的明显提升,把图像生成放进生产流程,附官方提示词指南
  • Grok悄悄上线的 Imagine到底是什么?一句话即可生成图片流,超速转15秒的视频
  • DeepSeek登上了《Nature》封面!国内首家大模型!
评论 (0)
请登录后发表评论
分类精选
Cursor 限制国内使用 Claude 等模型解决方案!
27079 8月前
学生/非学生:如何申请Cursor Pro免费会员,如何通过SheerID验证快速激活全攻略
25172 11月前
即梦AI图片2.1:一句话快速生成带中文的海报图,免费AI文生图、视频工具、AIGC创作工具
17126 1年前
注意!Cursor单设备登录新规:一个账户最多可以3台设备登录,且限制单点登录
16715 11月前
DeepSeek宣布:降价,最高降价75%!别错过这个优惠时段,赶紧充值
15112 1年前
字节跳动发布"扣子空间":AI协同办公的通用Agent平台开启效率革命
13599 11月前
刚刚!Cursor风控又加强了,可能是因为这个原因!
13598 11月前
Trae国内版,搭载 doubao-1.5-pro、DeepSeek R1/V3模型,对比 Trae 国际版有什么不同
13022 1年前
字节推出Trae CLI :Claude Code 和 Gemini CLI的国产平替 ?手把手教你如何安装Trae Agent
11633 8月前
Cline:自动化编程的VSCode插件Claude Dev + Gemini 2.0,快速构建智能应用
11335 1年前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Claude Code的Harness Engineering公开后,全世界的 Agent 能力提高了一个档次
2 OpenClaw 官方在 X 平台正式宣布:旗下技能市场 ClawHub 推出中国官方镜像站,附中文界面,国内访问不再受限
3 Claude Code 源码大泄露,我看到了 AI Agent 即将爆发的 7 大能力
4 智谱 GLM-5V-Turbo 发布:原生多模态 Coding 基座模型
5 智谱推出 Super Z:微信、飞书直接对话 GLM-5,零配置使用大模型
6 阿里 Wan2.7-Image 实测:AI 捏脸、调色盘、3K 文本渲染、交互式编辑全评测
7 Claude Code 正式推出全自动模式 Auto mode:AI 全权接管权限审核,兼顾高自由度与零误操
8 腾讯ima知识库skills上线:教你如何把腾讯 IMA 知识库接入 OpenClaw 一步打通
9 litellm 投毒事件复盘与我的快速自查清单(含 OpenClaw 说明)
10 重磅|刚刚,智谱 GLM-5.1 全量开放!编码能力狂飙 28%,Claude Code 和 OpenClaw 手动配置教程
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联