2 月 23 日,Anthropic 发布一份措辞强烈的调查报告,直接点名 DeepSeek、月之暗面(Moonshot)与 MiniMax 三家中国头部 AI 公司,称其对旗舰模型 Claude 发动了工业化规模的“蒸馏攻击”。报告给出具体规模:共动用了约 2.4 万个可疑账号,触发约 1600 万次对话请求。

在这份文件中,Anthropic强调“蒸馏”作为一种常见技术本身并不违法,多数厂商都会以自家强模型蒸馏出轻量版本;

真正的问题在于“跨阵营”从竞争者模型中系统性提取核心能力,并将其重建到自家模型之中。
指控细节与溯源方式
报告称,三家公司的目标、手法与体量各不相同,并以月之暗面为例展开描述:所谓“攻击”聚焦在 Agent 推理、工具调用、代码分析、计算机视觉等方向,这些能力与其旗下 Kimi 的产品定位高度契合。
Anthropic 还表示,在后期阶段,月之暗面切换到更精确的模式,尝试提取并重建 Claude 的推理轨迹。
在溯源方法上,Anthropic表示依据请求的元数据特征,并与月之暗面多名高管的公开资料进行比对推断。
但报告并未披露具体员工信息或更详细的技术取证细节,这也引发外界对证据充分性的质疑。
MiniMax被指规模最大
Anthropic在报告中称,MiniMax 涉及的规模最大,且本次“捕获了完整的攻击生命周期”。
此外,在 Anthropic 发布新版 Claude 后,MiniMax 被指在 24 小时内将近一半相关流量切换至新模型。
从商业竞争延展至国家安全
引发更大争议的是,Anthropic 并未将此事仅归类为商业竞争。
报告声称 Claude 内置了用于防范生物武器研发与恶意网络攻击等高风险用途的安全护栏,但这些护栏在蒸馏过程中“高度可能丢失”,从而导致危险能力在缺乏保护机制的情况下扩散。

报告还将事件与芯片出口管制挂钩,指出:在未掌握这些“攻击”全貌时,中国实验室表面上的快速进步可能被误读为美国出口管制失效的证据;实际上,这些进步在相当程度上依赖于从美国模型中提取的能力。
言下之意,除了限制算力出口,也应关注并遏制此类“蒸馏攻击”的规模。
社交媒体反响与马斯克表态
报告发布后在社交平台引发热议,嘲讽与质疑声不断。
马斯克在平台上回击称,Anthropic 自身也曾大规模使用人类程序员的数据(意指训练数据来源争议),并批评该公司。

此前,Anthropic 宣布完成 300 亿美元融资、估值达 3800 亿美元时,马斯克也曾在评论区指责其模型在群体偏见等问题上存在严重缺陷,并使用“仇视人类、邪恶”等尖锐表述。

此外,马斯克早在 1 月就嘲讽过“Anthropic”这一名称,认为一家以“人类”命名的公司,却在做“反人类”的事,颇具讽刺意味。
外界质疑的焦点
不少网友与观察者认为,商业层面的博弈可以理解,但这份报告尚未提供足以服众的直接证据,同时将技术争议拔高到国家安全与地缘政治层面,容易引发对其动机的联想与不满。
报告原文:https://www.anthropic.com/news/detecting-and-preventing-distillation-attacks