当前位置：首页 » AI最新动态

Claude Code的Harness Engineering公开后，全世界的 Agent 能力提高了一个档次

3月前 AI最新动态 668 0

安全研究员 Chaofan Shou 发现 Anthropic 发布在 npm 上的 Claude Code 包里，有一个 57MB 的 .map 文件没被排除。

通过这个文件可以还原出全部 1,906 个 TypeScript 源文件，512,000 行代码。

泄漏原因很低级——Bun 打包器默认生成 source map，.npmignore 没加排除规则。

更讽刺的是，源码里有一个叫 Undercover Mode 的子系统，专门防止 AI 在 git commit 里泄漏内部代号。

苏米注：这篇文章不聊八卦，聊聊这 51 万行代码里藏着什么值得学的工程设计，以及泄漏之后 24 小时内全球开发者造出了什么。

51 万行代码到底在干什么

没有一行在训练模型，全部都是 Harness Engineering：工具系统、权限管控、记忆整理、上下文压缩、多 Agent 协调、遥测监控。模型只是一个 API 调用。

ShareAI Lab 的逆向工程团队总结了一句话：模型是大脑，Harness 是身体。没有身体，大脑什么也做不了。

6 个值得学的工程决策

1. 被禁用的工具，连 Schema 都不发给模型

Claude Code 里约 40 个工具，29,000 行定义代码。被拒绝的工具，模型的工具列表里看不到，自然不会去调用。

苏米注：我之前搭 OpenClaw 的 agent，在 prompt 里写了一堆「不可以调用 XX 工具」，模型照调不误。改成不注册 Schema 之后，幻觉调用直接没了。

2. 上下文用到 92% 自动压缩

压缩比 6.8 倍，语义损失不超过 3%。150K token 压到 25K。有六种不同的压缩策略，根据 session 状态动态选择。

上下文管理不是优化项，是架构决策。

3. Agent 会自己做梦

后台有个服务叫 autoDream。触发条件：距上次 Dream 超过 24 小时 + 至少 5 个新 session + 获取排他锁。触发后执行四个阶段：感知、采集、整合、修剪。这个 Dream 子 Agent 只有只读权限。

大多数 Agent 的记忆就是把对话存档。Claude Code 的记忆是会自己整理笔记的。

4. 文件编辑不用 diff，用字符串替换

FileEditTool 接受 old_string 和 new_string。不用 unified diff，不用行号。让 LLM 生成合法 diff 太容易出错。字符串替换更不容易出错，在 Agent 工程里可靠性永远排在优雅前面。

5. 系统提示词切成静态和动态两段

静态段命中 API prompt cache 不花钱。动态段根据项目变化。一刀切两段，成本直接降下来。

6. 多 Agent 协调要防偷懒

Coordinator 的 prompt 里写死了一条规则：Do NOT say 'based on your findings' — read the actual findings and specify exactly what to do.

踩坑记录：我之前搭多 Agent 系统踩过完全一样的坑。主 Agent 指令太模糊，子 Agent 输出一堆无关内容，最后质量还不如单 Agent。

Claude Code vs Codex 核心分歧

维度	Codex	Claude Code
安全层级	操作系统内核层	应用层
沙箱技术	Seatbelt、Landlock、seccomp	17 个生命周期钩子，6 层安全门控
粒度	粗，逃逸难度极高	细，可编程性强
运行环境	云端容器	用户进程共享边界

Codex 选了绝对隔离，Claude Code 选了精细控制。

泄漏之后 24 小时，全球开发者造了什么

截至今天，GitHub 上标记 claude-code 的仓库超过 14,691 个。覆盖 Python、TypeScript、Shell、JavaScript、Go、Rust 六种语言。

一、洁净室重写：四种语言，不到 24 小时

claw-code（Python + Rust）：2 小时内拿了 50,000 stars，24 小时内突破 100,000 stars。GitHub 历史上增长最快的仓库。创建者 Sigrid Jin 是 Claude Code 最活跃的用户之一，一年消耗了 250 亿 token。

Kuberwastaken/claude-code（Rust）：方法更严谨，一个 AI Agent 分析源码产出行为规格，另一个 Agent 仅根据规格实现。

opensolon/soloncode（Java）：Gitee 上的 Java 实现，面向中国企业开发者生态。

二、教学项目：把架构变成课程

learn-claude-code（46,200 stars）：副标题「Bash is all you need」。12 个课时，每个课时逆向工程一个机制：Agent 循环、工具使用、子 Agent 生成、技能加载、上下文压缩、任务系统、后台任务、Agent 团队、自主 Agent、worktree 隔离。

核心理念：模型就是 Agent，代码就是 Harness。Build great harnesses, not just great models.

总结

源码本身会过时，但它催生的开源生态不会。这次泄漏事件真正改变的是 Agent 开发格局——让更多人理解了 Harness Engineering 的重要性。

最佳实践：不要只关注模型能力，更要关注如何构建可靠的 Harness 系统。工具设计、上下文管理、多 Agent 协调，这些工程决策才是决定 Agent 能力的关键。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：Claude Code的Harness Engineering公开后，全世界的 Agent 能力提高了一个档次

请登录后发表评论