当前位置：首页 » AI最新动态

Claude Fable 5 全球下线始末，当安全叙事成为监管利器

2小时前 AI最新动态 14 0

6 月 9 日，Anthropic 发布了有史以来最强大的公开模型 Claude Fable 5。6 月 12 日晚间 10 点，这个模型对全球所有用户彻底下线。

中间只隔了 72 小时。而把它送上断头台的，正是 Anthropic 最大的金主——Amazon。

这是 AI 行业诞生以来，美国政府首次动用出口管制手段，直接封杀一家公司的 AI 模型。

事件涉及国家安全、企业博弈、政治角力，以及一个根本性的问题：当一家公司花了数年时间告诉全世界自己的模型是"网络武器"，政府真的听进去了，然后呢？

先搞清楚：Mythos、Fable、Glasswing 到底是什么

要理解这次事件，得先理解 Anthropic 构建的这套产品体系。

故事要从今年 3 月说起。当时 Anthropic 的内容管理系统出现配置失误，泄露了一批内部文档草稿，其中提到了一个名为 Claude Mythos 的未发布模型。泄露信息显示，Mythos 在网络安全能力上远超现有模型，能够自主发现和串联多个零日漏洞（zero-day exploits），覆盖主流操作系统和浏览器。

4 月，Anthropic 正式推出 Claude Mythos Preview，同时启动了一个名为 Project Glasswing 的限制性合作项目。参与方包括 AWS、Apple、Google、Microsoft、Cisco、JPMorgan Chase、CrowdStrike 等巨头，以及部分政府机构。Glasswing 的逻辑很简单：Mythos 太强了，不能公开发布，但可以给"好人"用，让防御者先于攻击者发现漏洞。

到了 6 月 9 日，Anthropic 觉得时机成熟，发布了两个新模型：

Claude Fable 5：面向公众的版本，底层就是 Mythos，但加了一层安全护栏。涉及网络安全的敏感请求会被分类器拦截，重定向到能力较弱的 Claude Opus 4.8 处理。
Claude Mythos 5：Glasswing 合作伙伴的升级版，解除了网络安全相关的限制。

Anthropic 在发布博客中坦言：完美的越狱防御目前不可能实现。他们采用的是"纵深防御"策略——让越狱要么范围很窄，要么代价极高，同时配合监控系统快速发现和阻断攻击。这段话后来成了 Anthropic 自我辩护的核心论据，也成了政府反击的靶心。

48 小时内发生了什么

6 月 11 日（周四）晚间

Amazon 的研究团队声称成功绕过了 Fable 5 的安全护栏，能够让模型输出可用于网络攻击的信息。Amazon CEO Andy Jassy 当晚直接致电白宫，与财政部长 Scott Bessent 等高级官员通报了这一发现。同一时间段，至少 5 家其他公司也向政府表达了类似担忧。

6 月 12 日（周五）上午

事态迅速升级到白宫最高层。Bessent、白宫 AI 事务负责人 Lynne Cairncross、幕僚长 Susie Wiles 等召开紧急会议。随后，政府官员与 Anthropic 进行了长达数小时的沟通，核心诉求只有两个：修复越狱漏洞，或者暂停模型部署。Anthropic 拒绝了。

Anthropic 的论点很明确：这个越狱范围很窄，只能让模型读取特定代码库并修复软件缺陷——这本来就是开发者每天在做的事；所发现的漏洞都是已知的、轻微的；同样的能力在 OpenAI 的 GPT-5.5 上无需越狱就能实现。

6 月 12 日下午

谈判破裂。政府给了 Anthropic 90 分钟的最后通牒。下午 5:21，商务部长 Howard Lutnick 正式签发出口管制指令，要求 Anthropic 暂停所有外国公民对 Fable 5 和 Mythos 5 的访问——无论这些人在美国境内还是境外，甚至包括 Anthropic 自己的非美籍员工。

晚间约 10 点，由于 Anthropic 无法实时验证数亿用户的国籍，唯一的合规选择是对所有人关闭这两个模型。Fable 5 和 Mythos 5 全球下线。

两个完全不同的叙事

事件发生后，政府和 Anthropic 各执一词，双方的分歧几乎不可调和。

政府方面（David Sacks 版本）

6 月 14 日，前白宫 AI 沙皇、现任总统科技顾问委员会联席主席 David Sacks 在 X 上发布长帖，代表政府立场。核心观点：

Fable 就是加了护栏的 Mythos。如果护栏失效，Mythos 的高级网络攻击能力就会暴露给不该接触它的人。
Anthropic 自己一直在大力宣传 Mythos 是网络武器、需要政府监管。他们主动要求政府监管 Mythos，也支持 Fable 的护栏设计。
一个"高度可信的合作伙伴"在测试 Fable 时发现了护栏被绕过的方法。政府要求修复或下架，Dario 拒绝了。

Sacks 的措辞相当尖锐：Anthropic 在博客中说这个越狱"不严重"，但"淡化网络武器越狱风险"的说法与 Anthropic"AI 安全公司"的品牌定位严重矛盾。

Anthropic 方面

Anthropic 在官方声明中的态度同样强硬：

政府只提供了一个"口头的、狭窄的、非通用的"潜在越狱证据，本质上就是让模型读取特定代码库并修复软件缺陷。
他们验证了相关报告，认为其中展示的能力在其他公开模型（包括 GPT-5.5）上同样可以实现，属于防御者日常使用的正常功能。
Fable 的护栏经过数千小时的红队测试，没有任何测试者找到过通用越狱方法。

Anthropic 还说了一句很重的话："如果这个标准被推广到全行业，基本上所有前沿模型供应商的新模型部署都会被叫停。"

房间里的大象：Amazon

整个事件中最耐人寻味的角色是 Amazon。Amazon 是 Anthropic 最大的投资方之一，投入了数十亿美元，并获得了 1000 亿美元的云服务支出承诺。Fable 5 和 Mythos 5 在 Amazon Bedrock 上线，AWS 是重要的分发渠道。

然而，正是 Amazon 的 CEO Andy Jassy 亲自打电话给白宫，报告了越狱风险，直接触发了这场风暴。Amazon 的官方回应很克制："作为服务大量公私部门客户的云服务提供商，政府就潜在安全风险征求我们的意见并不罕见。"但问题摆在那里：一个公司的最大金主，把这个公司的产品告到了政府那里。

苏米注：安全研究者 Katie Moussouris 指出，政府的反应"似乎与研究报告中的实际内容严重不成比例"。研究人员提出的问题就是正常防御者会问 AI 的问题，这正是模型被设计来做的事情。

更深层的背景：Anthropic 与白宫的旧怨

这件事不能脱离 Anthropic 与 Trump 政府之间的长期紧张关系来理解。今年早些时候，双方就曾因为 AI 的军事用途产生过激烈冲突。据报道，Anthropic 拒绝签署一份扩展协议，该协议涉及对美国民众的大规模国内监控以及全自主致命武器系统。

Sacks 在帖子中特意澄清，出口管制行动与此前的摩擦无关。但分析人士普遍持怀疑态度。有评论指出：同样的越狱方法在 GPT-5.5 上也能复现，为什么只有 Anthropic 被制裁？出口管制指令在周五下午 5:21 发出，没有附带书面技术细节——"这看起来更像是一个愤怒的政府在找特定公司的麻烦。"

讽刺的是，就在 Fable被封的前两天，Dario Amodei 刚发布了一篇博文，呼吁"激活一个缓慢而老旧的政策机器来应对风险和机遇"，并明确表示"政府应该有权阻止或威慑不安全的高风险模型部署"。他说对了。只是没想到第一个被阻止的是自己。

这件事的本质是什么

剥开层层叙事，这件事的核心矛盾其实很简单：

Anthropic 花了数年时间建立"我们的模型太危险了，需要特别对待"的叙事，现在这个叙事被政府原样奉还。

当你反复告诉华盛顿你的产品是网络武器、需要被监管，当政府真的因此采取行动时，你很难再说"其实没那么严重"。正如一位分析师所说："你不能花几年时间告诉华盛顿你的产品是国家安全威胁，然后在他们真的当回事的时候说'哦，那只是营销而已'。"

但 Anthropic 的技术论点也有道理。如果一个"狭窄的、非通用的"越狱就足以触发出口管制，那么按照同样的标准，市面上几乎没有任何前沿模型能继续运营。GPT-5.5 能做到同样的事情，却不受任何限制。这种选择性执法的合理性确实值得质疑。

事件还暴露了一个更深层的制度空白：美国目前没有一套透明的、基于技术事实的 AI 安全监管框架。整个决策过程——从 Amazon 打电话到出口管制令签发——不到 24 小时，没有正式的技术评估程序，没有公开的标准，也没有申诉机制。TechPolicy.Press 将其形容为"白宫在即兴发挥"。

接下来会怎样

根据目前的信息，有三条可能的路径：

最快路径：政府撤回。Anthropic 证明越狱确实狭窄且在其他模型上同样可复现，政府接受技术论据，解除管制。Sacks 已经暗示这是政府希望看到的结果。
最可能路径：协商修复。Anthropic 推出补丁和额外的安全措施，双方各退一步，模型带着更严格的限制重新上线。
最极端路径：法律挑战。Anthropic 通过法律途径质疑出口管制的合法性和程序正当性。考虑到 Anthropic 正在筹备今年秋季的 IPO，这条路虽然最慢，但也不能排除。

值得注意的是，Anthropic 已经在秘密递交上市文件。Fable 的下架对其 IPO 叙事构成了直接冲击。这不仅仅是一个安全问题，更是一个价值数十亿美元的商业问题。

结语

这个故事里没有绝对的好人或坏人。Anthropic 确实建立了行业最严格的安全护栏，也确实做了最诚实的风险披露。但他们低估了一件事：当你把"我们的模型是武器"写进每一份文件、每一次演讲、每一篇博文时，你就已经交出了武器的定义权。

政府方面，在没有成熟监管框架的情况下用出口管制来解决模型安全问题，确实显得粗糙且可能不成比例。一个周五下午 5 点紧急签发的、不附带技术细节的指令，很难被称为"透明、公正、基于技术事实"的治理。

唯一确定的是：AI 行业从此进入了一个新阶段。政府已经证明它有意愿、也有工具在数小时内关闭一个面向数亿用户的 AI 产品。无论你觉得这次行动是否合理，这个先例已经被创造了。

参考资料：Anthropic 官方声明、Axios 独家报道、Politico 调查报道、David Sacks X 平台帖文、Yahoo Finance、Fortune、TechCrunch、VentureBeat 等。

声明：本站原创文章文字版权归本站所有，转载务必注明作者和出处；本站转载文章仅仅代表原作者观点，不代表本站立场，图文版权归原作者所有。如有侵权，请联系我们删除。

未经允许不得转载：Claude Fable 5 全球下线始末，当安全叙事成为监管利器

请登录后发表评论