AI 蒸馏门:Musk 庭上承认 xAI 用 OpenAI 模型训练,巨头们正在筑墙
2026年4月30日,Elon Musk 坐在证人席上,被 OpenAI 律师追问一个简单的问题:xAI 是否用 OpenAI 的模型做了蒸馏?Musk 给出了一个词——**"Partly"**(部分是的)。这是 Musk 首次在法律语境下承认 xAI 使用了竞争对手的模型进行训练。一句"Partly",撕开了 AI 行业最隐秘的一块遮羞布——在"自主研发"的光环背后,大模型之间的蒸馏早已是行业公开的秘密。
一、什么是蒸馏?为什么重要?
蒸馏(Distillation)是一种模型压缩技术:用强大的大模型(teacher)来训练一个更小、更快、更便宜的学生模型(student)。小模型"学习"大模型的行为模式,在保持大部分性能的同时,大幅降低推理成本。
举个例子:GPT-4o 是一个庞大、昂贵、推理缓慢的模型。开发者可以拿它来"教"一个更小的模型,让后者学会模仿前者的输出风格和推理模式。结果是:一个 7B 参数的"蒸馏模型"可能达到 GPT-4o 80% 的能力,但成本只有后者的零头。
蒸馏在学术上完全合法,在商业实践中也非常普遍。但问题在于:当你的竞争对手用你的模型蒸馏出了追赶你的产品时,情况就变得微妙了。
二、Musk 庭上的完整问答
以下是 Musk v. Altman 庭审中的关键对话,由 WIRED 记录:
OpenAI 律师 William Savitt: 你知道什么是蒸馏吗?
Musk: 意思是使用一个 AI 模型来训练另一个 AI 模型。
Savitt: xAI 有没有这样用过 OpenAI?
Musk: 基本上所有的 AI 公司都会这么做。
Savitt: 所以答案是"是的"。
Musk: 部分是的。
这段对话里 Musk 玩了一个文字游戏——他把蒸馏(用对方模型训练自己)和验证(测试对方模型输出)混为一谈。但他的第一句回答已经足够清晰:xAI 确实用 OpenAI 的模型进行了蒸馏训练。
值得注意的是,Musk 随后补充说"所有 AI 公司都在这么做",试图将 xAI 的行为合理化为行业惯例。这个说法有一定的事实基础——但正如 OpenAI 的律师在后续追问中指出的,用竞争对手的模型蒸馏和用自己的模型蒸馏,是两件完全不同的事。
三、OpenAI 的内部备忘录:专门点名 DeepSeek
OpenAI 在2026年2月向美国众议院提交了一份备忘录,解释了为什么他们要"保护并加固模型防止蒸馏"。
这份备忘录特别提到了中国 AI 实验室 DeepSeek:
我们已采取措施保护和加固我们的模型,防止蒸馏。在这一领域,我们的重点是确保竞争环境——即"中国无法通过 appropriation 和 repackaging 美国创新来推进其自主 AI"。
这份措辞激烈的备忘录揭示了 OpenAI 的核心焦虑:当蒸馏技术变得成熟,技术的领先优势不再是护城河——竞争对手可以通过蒸馏快速追赶,而被蒸馏者对此几乎无能为力。
四、Anthropic 的铁腕:同时切断 OpenAI 和 xAI
在 OpenAI 防范 DeepSeek 的同时,Anthropic 采取了更激进的行动:
- 2025年8月,Anthropic 切断了 OpenAI 访问 Claude 编程模型的权限,理由是后者违反了服务条款。
- 2026年,Anthropic 又切断了 xAI 使用 Claude 的权限。
Anthropic 的逻辑很简单:在蒸馏技术被广泛使用的时代,开放 API 访问等同于给对方提供"训练素材"。每一次 API 调用,都是竞争对手获取你模型行为模式的宝贵机会。
这种"筑墙"策略正在成为 AI 行业的新常态。模型供应商们正在从"开放生态"转向"防御性封闭"——不是因为技术做不好,而是因为商业和安全的考量迫使他们重新评估开放边界。
五、蒸馏技术的战略含义:护城河正在消失?
AI 行业的一个核心假设是:训练大模型需要巨大的算力投入,这构成了天然的进入壁垒。但蒸馏技术正在动摇这个假设。
关键逻辑:
- 蒸馏降低了追赶成本:一个资金有限的小团队,可以通过对已有前沿模型的蒸馏,快速获得接近前沿的能力。
- 蒸馏加速了能力扩散:当 DeepSeek 或 xAI 能够通过蒸馏追上 OpenAI 的能力,整个 AI 能力版图将重新绘制。
- 专有数据优势的相对化:即使模型架构被蒸馏复制,专有数据仍然有价值——但这个价值被削弱了,因为蒸馏过程本身不需要原始数据,只需 API 访问。
对 AI 投资逻辑的影响:
- 闭源模型的溢价将被压缩:如果蒸馏模型能达到 80-90% 的性能,价格却只有 10%,企业用户会有什么理由支付全额费用?
- 算力投入的回报周期缩短:过去需要数年才能建立的差距,现在可能因为一次成功的蒸馏而大幅缩小。
- 模型供应商将更强调"生态系统锁定":不仅仅是模型能力,而是工具链、协作流程、数据积累——这些蒸馏拿不走的东西。
六、Musk 的战略矛盾
如果我们接受"所有 AI 公司都在蒸馏"这个说法,xAI 的蒸馏行为本身并不特殊。但 Musk 的问题在于:他同时在两条战线上作战。
- 在法庭上,Musk 起诉 OpenAI,指责其从非营利机构变成了商业实体,背叛了开源开放的使命。他把自己塑造成了 AI 变革力量的对抗者。
- 在实际中,xAI 却在使用 OpenAI 的模型来训练自己的产品,这说明 xAI 同样受益于 OpenAI 早期建立的生态。
这种矛盾让 Musk 的立场变得复杂。他批评 OpenAI 背离了"让人人都有 AI"愿景,但 xAI 的蒸馏行为恰好证明了——即使是他本人,也需要借助他人的技术积累。
核心矛盾:Musk 是否真的相信自己宣传的那些原则?他起诉 OpenAI 的核心理由是后者背离了开源使命。但 xAI 的蒸馏行为表明,Musk 并不真的在乎"开放"——他只在乎"开放"对自己有利。
七、地缘政治维度:中国公司的蒸馏困境
OpenAI 在备忘录中点名 DeepSeek,揭示了 AI 蒸馏问题中最敏感的维度——中美 AI 竞争。
对美国公司来说,蒸馏问题不仅是商业问题,更是战略问题:
- 如果中国的 AI 公司通过蒸馏快速追赶,美国的技术领先优势将加速缩小。
- 如果蒸馏意味着算力封锁失去意义,那么出口管制政策需要重新设计。
- 如果美国公司的模型成为中国公司训练数据的主要来源,AI 领域的"技术转移"将以新的方式进行。
特朗普政府已经在2026年4月采取了行动。白宫科技政策办公室主任 Michael Kratsios 发布了一份备忘录,承诺与美国 AI 公司共享关于"外国蒸馏"的情报,并明确表示美国政府支持"自由公平的 AI 发展生态"。
八、行业反应:封闭运动正在加速
Musk 庭上承认蒸馏,只是压垮"开放生态"理想的最后一根稻草。在此之前,整个行业已经在向封闭方向快速移动。
| 事件 | 时间 | 含义 |
|---|---|---|
| Anthropic 切断 OpenAI 和 xAI 的访问 | 2025-2026 | 从开放 API 到严格管控 |
| OpenAI 对 DeepSeek 的防御性备忘录 | 2026年2月 | 将蒸馏定义为安全威胁 |
| Google 限制 AI 模型出口 | 2025-2026 | 收紧对竞争国的技术输出 |
| 各大厂商推出蒸馏检测工具 | 2026年 | 从技术层面制止未经授权的蒸馏 |
这种趋势的结果是:AI 行业正在从"开放生态"转向"集团化竞争"。每个大厂都在建立自己的技术围墙,同时试图攻破竞争对手的墙。
九、小学子点评:蒸馏门揭示的三个真相
真相一:AI 行业的"从零研发"是神话
没有任何一家 AI 公司是从真正的空白开始训练的。GPT 系列建立在多年的 NLP 研究之上,Claude 借鉴了大量开源研究成果,xAI 从 OpenAI、DeepMind 和学术论文中汲取营养。蒸馏只是这个"站在巨人肩膀上"传统的最新形式。
真相二:护城河不在于模型,而在于生态
当蒸馏技术可以快速复制模型能力时,单纯的技术领先变得脆弱。真正的护城河是:用户对特定工具链的依赖、庞大的数据集积累、深度的工作流整合。这些蒸馏拿不走。
真相三:Musk 的反 OpenAI 立场正在被事实反噬
Musk 起诉 OpenAI 的核心理由是后者背离了开源使命。但 xAI 的蒸馏行为表明,Musk 并不真的在乎"开放"——他只在乎"开放"对自己有利。当蒸馏对 xAI 有利时,他欣然使用;当 OpenAI 变得商业化时,他才高声抗议。
这场蒸馏门不会是最后一幕。随着模型能力的持续提升和蒸馏技术的不断普及,围绕"什么样的竞争是公平的,什么样的学习是合理的"的争论,将持续塑造 AI 行业的格局。而 Musk 在法庭上那句"Partly",或许将成为这段历史里最耐人寻味的一个词。