6 月 9 日,Anthropic 发布了有史以来最强大的公开模型 Claude Fable 5。6 月 12 日晚间 10 点,这个模型对全球所有用户彻底下线。
中间只隔了 72 小时。而把它送上断头台的,正是 Anthropic 最大的金主——Amazon。
这是 AI 行业诞生以来,美国政府首次动用出口管制手段,直接封杀一家公司的 AI 模型。
事件涉及国家安全、企业博弈、政治角力,以及一个根本性的问题:当一家公司花了数年时间告诉全世界自己的模型是"网络武器",政府真的听进去了,然后呢?
先搞清楚:Mythos、Fable、Glasswing 到底是什么
要理解这次事件,得先理解 Anthropic 构建的这套产品体系。
故事要从今年 3 月说起。当时 Anthropic 的内容管理系统出现配置失误,泄露了一批内部文档草稿,其中提到了一个名为 Claude Mythos 的未发布模型。泄露信息显示,Mythos 在网络安全能力上远超现有模型,能够自主发现和串联多个零日漏洞(zero-day exploits),覆盖主流操作系统和浏览器。
4 月,Anthropic 正式推出 Claude Mythos Preview,同时启动了一个名为 Project Glasswing 的限制性合作项目。参与方包括 AWS、Apple、Google、Microsoft、Cisco、JPMorgan Chase、CrowdStrike 等巨头,以及部分政府机构。Glasswing 的逻辑很简单:Mythos 太强了,不能公开发布,但可以给"好人"用,让防御者先于攻击者发现漏洞。
到了 6 月 9 日,Anthropic 觉得时机成熟,发布了两个新模型:
- Claude Fable 5:面向公众的版本,底层就是 Mythos,但加了一层安全护栏。涉及网络安全的敏感请求会被分类器拦截,重定向到能力较弱的 Claude Opus 4.8 处理。
- Claude Mythos 5:Glasswing 合作伙伴的升级版,解除了网络安全相关的限制。
Anthropic 在发布博客中坦言:完美的越狱防御目前不可能实现。他们采用的是"纵深防御"策略——让越狱要么范围很窄,要么代价极高,同时配合监控系统快速发现和阻断攻击。这段话后来成了 Anthropic 自我辩护的核心论据,也成了政府反击的靶心。
48 小时内发生了什么
6 月 11 日(周四)晚间
Amazon 的研究团队声称成功绕过了 Fable 5 的安全护栏,能够让模型输出可用于网络攻击的信息。Amazon CEO Andy Jassy 当晚直接致电白宫,与财政部长 Scott Bessent 等高级官员通报了这一发现。同一时间段,至少 5 家其他公司也向政府表达了类似担忧。
6 月 12 日(周五)上午
事态迅速升级到白宫最高层。Bessent、白宫 AI 事务负责人 Lynne Cairncross、幕僚长 Susie Wiles 等召开紧急会议。随后,政府官员与 Anthropic 进行了长达数小时的沟通,核心诉求只有两个:修复越狱漏洞,或者暂停模型部署。Anthropic 拒绝了。
Anthropic 的论点很明确:这个越狱范围很窄,只能让模型读取特定代码库并修复软件缺陷——这本来就是开发者每天在做的事;所发现的漏洞都是已知的、轻微的;同样的能力在 OpenAI 的 GPT-5.5 上无需越狱就能实现。
6 月 12 日下午
谈判破裂。政府给了 Anthropic 90 分钟的最后通牒。下午 5:21,商务部长 Howard Lutnick 正式签发出口管制指令,要求 Anthropic 暂停所有外国公民对 Fable 5 和 Mythos 5 的访问——无论这些人在美国境内还是境外,甚至包括 Anthropic 自己的非美籍员工。
晚间约 10 点,由于 Anthropic 无法实时验证数亿用户的国籍,唯一的合规选择是对所有人关闭这两个模型。Fable 5 和 Mythos 5 全球下线。
两个完全不同的叙事
事件发生后,政府和 Anthropic 各执一词,双方的分歧几乎不可调和。
政府方面(David Sacks 版本)
6 月 14 日,前白宫 AI 沙皇、现任总统科技顾问委员会联席主席 David Sacks 在 X 上发布长帖,代表政府立场。核心观点:
- Fable 就是加了护栏的 Mythos。如果护栏失效,Mythos 的高级网络攻击能力就会暴露给不该接触它的人。
- Anthropic 自己一直在大力宣传 Mythos 是网络武器、需要政府监管。他们主动要求政府监管 Mythos,也支持 Fable 的护栏设计。
- 一个"高度可信的合作伙伴"在测试 Fable 时发现了护栏被绕过的方法。政府要求修复或下架,Dario 拒绝了。
Sacks 的措辞相当尖锐:Anthropic 在博客中说这个越狱"不严重",但"淡化网络武器越狱风险"的说法与 Anthropic"AI 安全公司"的品牌定位严重矛盾。
Anthropic 方面
Anthropic 在官方声明中的态度同样强硬:
- 政府只提供了一个"口头的、狭窄的、非通用的"潜在越狱证据,本质上就是让模型读取特定代码库并修复软件缺陷。
- 他们验证了相关报告,认为其中展示的能力在其他公开模型(包括 GPT-5.5)上同样可以实现,属于防御者日常使用的正常功能。
- Fable 的护栏经过数千小时的红队测试,没有任何测试者找到过通用越狱方法。
Anthropic 还说了一句很重的话:"如果这个标准被推广到全行业,基本上所有前沿模型供应商的新模型部署都会被叫停。"
房间里的大象:Amazon
整个事件中最耐人寻味的角色是 Amazon。Amazon 是 Anthropic 最大的投资方之一,投入了数十亿美元,并获得了 1000 亿美元的云服务支出承诺。Fable 5 和 Mythos 5 在 Amazon Bedrock 上线,AWS 是重要的分发渠道。
然而,正是 Amazon 的 CEO Andy Jassy 亲自打电话给白宫,报告了越狱风险,直接触发了这场风暴。Amazon 的官方回应很克制:"作为服务大量公私部门客户的云服务提供商,政府就潜在安全风险征求我们的意见并不罕见。"但问题摆在那里:一个公司的最大金主,把这个公司的产品告到了政府那里。
苏米注:安全研究者 Katie Moussouris 指出,政府的反应"似乎与研究报告中的实际内容严重不成比例"。研究人员提出的问题就是正常防御者会问 AI 的问题,这正是模型被设计来做的事情。
更深层的背景:Anthropic 与白宫的旧怨
这件事不能脱离 Anthropic 与 Trump 政府之间的长期紧张关系来理解。今年早些时候,双方就曾因为 AI 的军事用途产生过激烈冲突。据报道,Anthropic 拒绝签署一份扩展协议,该协议涉及对美国民众的大规模国内监控以及全自主致命武器系统。
Sacks 在帖子中特意澄清,出口管制行动与此前的摩擦无关。但分析人士普遍持怀疑态度。有评论指出:同样的越狱方法在 GPT-5.5 上也能复现,为什么只有 Anthropic 被制裁?出口管制指令在周五下午 5:21 发出,没有附带书面技术细节——"这看起来更像是一个愤怒的政府在找特定公司的麻烦。"
讽刺的是,就在 Fable被封的前两天,Dario Amodei 刚发布了一篇博文,呼吁"激活一个缓慢而老旧的政策机器来应对风险和机遇",并明确表示"政府应该有权阻止或威慑不安全的高风险模型部署"。他说对了。只是没想到第一个被阻止的是自己。
这件事的本质是什么
剥开层层叙事,这件事的核心矛盾其实很简单:
Anthropic 花了数年时间建立"我们的模型太危险了,需要特别对待"的叙事,现在这个叙事被政府原样奉还。
当你反复告诉华盛顿你的产品是网络武器、需要被监管,当政府真的因此采取行动时,你很难再说"其实没那么严重"。正如一位分析师所说:"你不能花几年时间告诉华盛顿你的产品是国家安全威胁,然后在他们真的当回事的时候说'哦,那只是营销而已'。"
但 Anthropic 的技术论点也有道理。如果一个"狭窄的、非通用的"越狱就足以触发出口管制,那么按照同样的标准,市面上几乎没有任何前沿模型能继续运营。GPT-5.5 能做到同样的事情,却不受任何限制。这种选择性执法的合理性确实值得质疑。
事件还暴露了一个更深层的制度空白:美国目前没有一套透明的、基于技术事实的 AI 安全监管框架。整个决策过程——从 Amazon 打电话到出口管制令签发——不到 24 小时,没有正式的技术评估程序,没有公开的标准,也没有申诉机制。TechPolicy.Press 将其形容为"白宫在即兴发挥"。
接下来会怎样
根据目前的信息,有三条可能的路径:
- 最快路径:政府撤回。Anthropic 证明越狱确实狭窄且在其他模型上同样可复现,政府接受技术论据,解除管制。Sacks 已经暗示这是政府希望看到的结果。
- 最可能路径:协商修复。Anthropic 推出补丁和额外的安全措施,双方各退一步,模型带着更严格的限制重新上线。
- 最极端路径:法律挑战。Anthropic 通过法律途径质疑出口管制的合法性和程序正当性。考虑到 Anthropic 正在筹备今年秋季的 IPO,这条路虽然最慢,但也不能排除。
值得注意的是,Anthropic 已经在秘密递交上市文件。Fable 的下架对其 IPO 叙事构成了直接冲击。这不仅仅是一个安全问题,更是一个价值数十亿美元的商业问题。
结语
这个故事里没有绝对的好人或坏人。Anthropic 确实建立了行业最严格的安全护栏,也确实做了最诚实的风险披露。但他们低估了一件事:当你把"我们的模型是武器"写进每一份文件、每一次演讲、每一篇博文时,你就已经交出了武器的定义权。
政府方面,在没有成熟监管框架的情况下用出口管制来解决模型安全问题,确实显得粗糙且可能不成比例。一个周五下午 5 点紧急签发的、不附带技术细节的指令,很难被称为"透明、公正、基于技术事实"的治理。
唯一确定的是:AI 行业从此进入了一个新阶段。政府已经证明它有意愿、也有工具在数小时内关闭一个面向数亿用户的 AI 产品。无论你觉得这次行动是否合理,这个先例已经被创造了。
参考资料:Anthropic 官方声明、Axios 独家报道、Politico 调查报道、David Sacks X 平台帖文、Yahoo Finance、Fortune、TechCrunch、VentureBeat 等。