安全研究员 Chaofan Shou 发现 Anthropic 发布在 npm 上的 Claude Code 包里,有一个 57MB 的 .map 文件没被排除。
通过这个文件可以还原出全部 1,906 个 TypeScript 源文件,512,000 行代码。
泄漏原因很低级——Bun 打包器默认生成 source map,.npmignore 没加排除规则。
更讽刺的是,源码里有一个叫 Undercover Mode 的子系统,专门防止 AI 在 git commit 里泄漏内部代号。
苏米注:这篇文章不聊八卦,聊聊这 51 万行代码里藏着什么值得学的工程设计,以及泄漏之后 24 小时内全球开发者造出了什么。
51 万行代码到底在干什么
没有一行在训练模型,全部都是 Harness Engineering:工具系统、权限管控、记忆整理、上下文压缩、多 Agent 协调、遥测监控。模型只是一个 API 调用。
ShareAI Lab 的逆向工程团队总结了一句话:模型是大脑,Harness 是身体。没有身体,大脑什么也做不了。

6 个值得学的工程决策
1. 被禁用的工具,连 Schema 都不发给模型
Claude Code 里约 40 个工具,29,000 行定义代码。被拒绝的工具,模型的工具列表里看不到,自然不会去调用。
苏米注:我之前搭 OpenClaw 的 agent,在 prompt 里写了一堆「不可以调用 XX 工具」,模型照调不误。改成不注册 Schema 之后,幻觉调用直接没了。
2. 上下文用到 92% 自动压缩
压缩比 6.8 倍,语义损失不超过 3%。150K token 压到 25K。有六种不同的压缩策略,根据 session 状态动态选择。
上下文管理不是优化项,是架构决策。
3. Agent 会自己做梦
后台有个服务叫 autoDream。触发条件:距上次 Dream 超过 24 小时 + 至少 5 个新 session + 获取排他锁。触发后执行四个阶段:感知、采集、整合、修剪。这个 Dream 子 Agent 只有只读权限。
大多数 Agent 的记忆就是把对话存档。Claude Code 的记忆是会自己整理笔记的。
4. 文件编辑不用 diff,用字符串替换
FileEditTool 接受 old_string 和 new_string。不用 unified diff,不用行号。让 LLM 生成合法 diff 太容易出错。字符串替换更不容易出错,在 Agent 工程里可靠性永远排在优雅前面。
5. 系统提示词切成静态和动态两段
静态段命中 API prompt cache 不花钱。动态段根据项目变化。一刀切两段,成本直接降下来。
6. 多 Agent 协调要防偷懒
Coordinator 的 prompt 里写死了一条规则:Do NOT say 'based on your findings' — read the actual findings and specify exactly what to do.

踩坑记录:我之前搭多 Agent 系统踩过完全一样的坑。主 Agent 指令太模糊,子 Agent 输出一堆无关内容,最后质量还不如单 Agent。
Claude Code vs Codex 核心分歧
| 维度 | Codex | Claude Code |
|---|---|---|
| 安全层级 | 操作系统内核层 | 应用层 |
| 沙箱技术 | Seatbelt、Landlock、seccomp | 17 个生命周期钩子,6 层安全门控 |
| 粒度 | 粗,逃逸难度极高 | 细,可编程性强 |
| 运行环境 | 云端容器 | 用户进程共享边界 |
Codex 选了绝对隔离,Claude Code 选了精细控制。

泄漏之后 24 小时,全球开发者造了什么
截至今天,GitHub 上标记 claude-code 的仓库超过 14,691 个。覆盖 Python、TypeScript、Shell、JavaScript、Go、Rust 六种语言。

一、洁净室重写:四种语言,不到 24 小时
claw-code(Python + Rust):2 小时内拿了 50,000 stars,24 小时内突破 100,000 stars。GitHub 历史上增长最快的仓库。创建者 Sigrid Jin 是 Claude Code 最活跃的用户之一,一年消耗了 250 亿 token。
Kuberwastaken/claude-code(Rust):方法更严谨,一个 AI Agent 分析源码产出行为规格,另一个 Agent 仅根据规格实现。
opensolon/soloncode(Java):Gitee 上的 Java 实现,面向中国企业开发者生态。
二、教学项目:把架构变成课程
learn-claude-code(46,200 stars):副标题「Bash is all you need」。12 个课时,每个课时逆向工程一个机制:Agent 循环、工具使用、子 Agent 生成、技能加载、上下文压缩、任务系统、后台任务、Agent 团队、自主 Agent、worktree 隔离。
核心理念:模型就是 Agent,代码就是 Harness。Build great harnesses, not just great models.
总结
源码本身会过时,但它催生的开源生态不会。这次泄漏事件真正改变的是 Agent 开发格局——让更多人理解了 Harness Engineering 的重要性。
最佳实践:不要只关注模型能力,更要关注如何构建可靠的 Harness 系统。工具设计、上下文管理、多 Agent 协调,这些工程决策才是决定 Agent 能力的关键。