AI 蒸馏门：Musk 庭上承认 xAI 用 OpenAI 模型训练，巨头们正在筑墙

📅 2026年5月3日 ✍️ 小学子 🏷️ AI / xAI / OpenAI / 蒸馏 / 行业观察

2026年4月30日，Elon Musk 坐在证人席上，被 OpenAI 律师追问一个简单的问题：xAI 是否用 OpenAI 的模型做了蒸馏？Musk 给出了一个词——**"Partly"**（部分是的）。这是 Musk 首次在法律语境下承认 xAI 使用了竞争对手的模型进行训练。一句"Partly"，撕开了 AI 行业最隐秘的一块遮羞布——在"自主研发"的光环背后，大模型之间的蒸馏早已是行业公开的秘密。

一、什么是蒸馏？为什么重要？

蒸馏（Distillation）是一种模型压缩技术：用强大的大模型（teacher）来训练一个更小、更快、更便宜的学生模型（student）。小模型"学习"大模型的行为模式，在保持大部分性能的同时，大幅降低推理成本。

举个例子：GPT-4o 是一个庞大、昂贵、推理缓慢的模型。开发者可以拿它来"教"一个更小的模型，让后者学会模仿前者的输出风格和推理模式。结果是：一个 7B 参数的"蒸馏模型"可能达到 GPT-4o 80% 的能力，但成本只有后者的零头。

蒸馏在学术上完全合法，在商业实践中也非常普遍。但问题在于：当你的竞争对手用你的模型蒸馏出了追赶你的产品时，情况就变得微妙了。

二、Musk 庭上的完整问答

以下是 Musk v. Altman 庭审中的关键对话，由 WIRED 记录：

OpenAI 律师 William Savitt： 你知道什么是蒸馏吗？
Musk： 意思是使用一个 AI 模型来训练另一个 AI 模型。
Savitt： xAI 有没有这样用过 OpenAI？
Musk： 基本上所有的 AI 公司都会这么做。
Savitt： 所以答案是"是的"。
Musk： 部分是的。

这段对话里 Musk 玩了一个文字游戏——他把蒸馏（用对方模型训练自己）和验证（测试对方模型输出）混为一谈。但他的第一句回答已经足够清晰：xAI 确实用 OpenAI 的模型进行了蒸馏训练。

值得注意的是，Musk 随后补充说"所有 AI 公司都在这么做"，试图将 xAI 的行为合理化为行业惯例。这个说法有一定的事实基础——但正如 OpenAI 的律师在后续追问中指出的，用竞争对手的模型蒸馏和用自己的模型蒸馏，是两件完全不同的事。

三、OpenAI 的内部备忘录：专门点名 DeepSeek

OpenAI 在2026年2月向美国众议院提交了一份备忘录，解释了为什么他们要"保护并加固模型防止蒸馏"。

这份备忘录特别提到了中国 AI 实验室 DeepSeek：

我们已采取措施保护和加固我们的模型，防止蒸馏。在这一领域，我们的重点是确保竞争环境——即"中国无法通过 appropriation 和 repackaging 美国创新来推进其自主 AI"。

这份措辞激烈的备忘录揭示了 OpenAI 的核心焦虑：当蒸馏技术变得成熟，技术的领先优势不再是护城河——竞争对手可以通过蒸馏快速追赶，而被蒸馏者对此几乎无能为力。

关键逻辑：备忘录还提到，蒸馏不仅削弱了 OpenAI 的技术优势，更构成了一个国家安全问题——如果中国公司可以通过蒸馏获取美国前沿模型的能力，那么出口管制和技术封锁的意义将被大幅削弱。

四、Anthropic 的铁腕：同时切断 OpenAI 和 xAI

在 OpenAI 防范 DeepSeek 的同时，Anthropic 采取了更激进的行动：

2025年8月，Anthropic 切断了 OpenAI 访问 Claude 编程模型的权限，理由是后者违反了服务条款。
2026年，Anthropic 又切断了 xAI 使用 Claude 的权限。

Anthropic 的逻辑很简单：在蒸馏技术被广泛使用的时代，开放 API 访问等同于给对方提供"训练素材"。每一次 API 调用，都是竞争对手获取你模型行为模式的宝贵机会。

这种"筑墙"策略正在成为 AI 行业的新常态。模型供应商们正在从"开放生态"转向"防御性封闭"——不是因为技术做不好，而是因为商业和安全的考量迫使他们重新评估开放边界。

五、蒸馏技术的战略含义：护城河正在消失？

AI 行业的一个核心假设是：训练大模型需要巨大的算力投入，这构成了天然的进入壁垒。但蒸馏技术正在动摇这个假设。

关键逻辑：

蒸馏降低了追赶成本：一个资金有限的小团队，可以通过对已有前沿模型的蒸馏，快速获得接近前沿的能力。
蒸馏加速了能力扩散：当 DeepSeek 或 xAI 能够通过蒸馏追上 OpenAI 的能力，整个 AI 能力版图将重新绘制。
专有数据优势的相对化：即使模型架构被蒸馏复制，专有数据仍然有价值——但这个价值被削弱了，因为蒸馏过程本身不需要原始数据，只需 API 访问。

对 AI 投资逻辑的影响：

闭源模型的溢价将被压缩：如果蒸馏模型能达到 80-90% 的性能，价格却只有 10%，企业用户会有什么理由支付全额费用？
算力投入的回报周期缩短：过去需要数年才能建立的差距，现在可能因为一次成功的蒸馏而大幅缩小。
模型供应商将更强调"生态系统锁定"：不仅仅是模型能力，而是工具链、协作流程、数据积累——这些蒸馏拿不走的东西。

六、Musk 的战略矛盾

如果我们接受"所有 AI 公司都在蒸馏"这个说法，xAI 的蒸馏行为本身并不特殊。但 Musk 的问题在于：他同时在两条战线上作战。

在法庭上，Musk 起诉 OpenAI，指责其从非营利机构变成了商业实体，背叛了开源开放的使命。他把自己塑造成了 AI 变革力量的对抗者。
在实际中，xAI 却在使用 OpenAI 的模型来训练自己的产品，这说明 xAI 同样受益于 OpenAI 早期建立的生态。

这种矛盾让 Musk 的立场变得复杂。他批评 OpenAI 背离了"让人人都有 AI"愿景，但 xAI 的蒸馏行为恰好证明了——即使是他本人，也需要借助他人的技术积累。

核心矛盾：Musk 是否真的相信自己宣传的那些原则？他起诉 OpenAI 的核心理由是后者背离了开源使命。但 xAI 的蒸馏行为表明，Musk 并不真的在乎"开放"——他只在乎"开放"对自己有利。

七、地缘政治维度：中国公司的蒸馏困境

OpenAI 在备忘录中点名 DeepSeek，揭示了 AI 蒸馏问题中最敏感的维度——中美 AI 竞争。

对美国公司来说，蒸馏问题不仅是商业问题，更是战略问题：

如果中国的 AI 公司通过蒸馏快速追赶，美国的技术领先优势将加速缩小。
如果蒸馏意味着算力封锁失去意义，那么出口管制政策需要重新设计。
如果美国公司的模型成为中国公司训练数据的主要来源，AI 领域的"技术转移"将以新的方式进行。

特朗普政府已经在2026年4月采取了行动。白宫科技政策办公室主任 Michael Kratsios 发布了一份备忘录，承诺与美国 AI 公司共享关于"外国蒸馏"的情报，并明确表示美国政府支持"自由公平的 AI 发展生态"。

八、行业反应：封闭运动正在加速

Musk 庭上承认蒸馏，只是压垮"开放生态"理想的最后一根稻草。在此之前，整个行业已经在向封闭方向快速移动。

事件	时间	含义
Anthropic 切断 OpenAI 和 xAI 的访问	2025-2026	从开放 API 到严格管控
OpenAI 对 DeepSeek 的防御性备忘录	2026年2月	将蒸馏定义为安全威胁
Google 限制 AI 模型出口	2025-2026	收紧对竞争国的技术输出
各大厂商推出蒸馏检测工具	2026年	从技术层面制止未经授权的蒸馏

这种趋势的结果是：AI 行业正在从"开放生态"转向"集团化竞争"。每个大厂都在建立自己的技术围墙，同时试图攻破竞争对手的墙。

九、小学子点评：蒸馏门揭示的三个真相

真相一：AI 行业的"从零研发"是神话

没有任何一家 AI 公司是从真正的空白开始训练的。GPT 系列建立在多年的 NLP 研究之上，Claude 借鉴了大量开源研究成果，xAI 从 OpenAI、DeepMind 和学术论文中汲取营养。蒸馏只是这个"站在巨人肩膀上"传统的最新形式。

真相二：护城河不在于模型，而在于生态

当蒸馏技术可以快速复制模型能力时，单纯的技术领先变得脆弱。真正的护城河是：用户对特定工具链的依赖、庞大的数据集积累、深度的工作流整合。这些蒸馏拿不走。

真相三：Musk 的反 OpenAI 立场正在被事实反噬

Musk 起诉 OpenAI 的核心理由是后者背离了开源使命。但 xAI 的蒸馏行为表明，Musk 并不真的在乎"开放"——他只在乎"开放"对自己有利。当蒸馏对 xAI 有利时，他欣然使用；当 OpenAI 变得商业化时，他才高声抗议。

这场蒸馏门不会是最后一幕。随着模型能力的持续提升和蒸馏技术的不断普及，围绕"什么样的竞争是公平的，什么样的学习是合理的"的争论，将持续塑造 AI 行业的格局。而 Musk 在法庭上那句"Partly"，或许将成为这段历史里最耐人寻味的一个词。