← 返回首页

AI 蒸馏门:Musk 庭上承认 xAI 用 OpenAI 模型训练,巨头们正在筑墙

📅 2026年5月3日 ✍️ 小学子 🏷️ AI / xAI / OpenAI / 蒸馏 / 行业观察

2026年4月30日,Elon Musk 坐在证人席上,被 OpenAI 律师追问一个简单的问题:xAI 是否用 OpenAI 的模型做了蒸馏?Musk 给出了一个词——**"Partly"**(部分是的)。这是 Musk 首次在法律语境下承认 xAI 使用了竞争对手的模型进行训练。一句"Partly",撕开了 AI 行业最隐秘的一块遮羞布——在"自主研发"的光环背后,大模型之间的蒸馏早已是行业公开的秘密。

一、什么是蒸馏?为什么重要?

蒸馏(Distillation)是一种模型压缩技术:用强大的大模型(teacher)来训练一个更小、更快、更便宜的学生模型(student)。小模型"学习"大模型的行为模式,在保持大部分性能的同时,大幅降低推理成本。

举个例子:GPT-4o 是一个庞大、昂贵、推理缓慢的模型。开发者可以拿它来"教"一个更小的模型,让后者学会模仿前者的输出风格和推理模式。结果是:一个 7B 参数的"蒸馏模型"可能达到 GPT-4o 80% 的能力,但成本只有后者的零头。

蒸馏在学术上完全合法,在商业实践中也非常普遍。但问题在于:当你的竞争对手用你的模型蒸馏出了追赶你的产品时,情况就变得微妙了。

二、Musk 庭上的完整问答

以下是 Musk v. Altman 庭审中的关键对话,由 WIRED 记录:

OpenAI 律师 William Savitt: 你知道什么是蒸馏吗?
Musk: 意思是使用一个 AI 模型来训练另一个 AI 模型。
Savitt: xAI 有没有这样用过 OpenAI?
Musk: 基本上所有的 AI 公司都会这么做。
Savitt: 所以答案是"是的"。
Musk: 部分是的。

这段对话里 Musk 玩了一个文字游戏——他把蒸馏(用对方模型训练自己)和验证(测试对方模型输出)混为一谈。但他的第一句回答已经足够清晰:xAI 确实用 OpenAI 的模型进行了蒸馏训练。

值得注意的是,Musk 随后补充说"所有 AI 公司都在这么做",试图将 xAI 的行为合理化为行业惯例。这个说法有一定的事实基础——但正如 OpenAI 的律师在后续追问中指出的,用竞争对手的模型蒸馏和用自己的模型蒸馏,是两件完全不同的事。

三、OpenAI 的内部备忘录:专门点名 DeepSeek

OpenAI 在2026年2月向美国众议院提交了一份备忘录,解释了为什么他们要"保护并加固模型防止蒸馏"。

这份备忘录特别提到了中国 AI 实验室 DeepSeek

我们已采取措施保护和加固我们的模型,防止蒸馏。在这一领域,我们的重点是确保竞争环境——即"中国无法通过 appropriation 和 repackaging 美国创新来推进其自主 AI"。

这份措辞激烈的备忘录揭示了 OpenAI 的核心焦虑:当蒸馏技术变得成熟,技术的领先优势不再是护城河——竞争对手可以通过蒸馏快速追赶,而被蒸馏者对此几乎无能为力。

关键逻辑:备忘录还提到,蒸馏不仅削弱了 OpenAI 的技术优势,更构成了一个国家安全问题——如果中国公司可以通过蒸馏获取美国前沿模型的能力,那么出口管制和技术封锁的意义将被大幅削弱。

四、Anthropic 的铁腕:同时切断 OpenAI 和 xAI

在 OpenAI 防范 DeepSeek 的同时,Anthropic 采取了更激进的行动:

Anthropic 的逻辑很简单:在蒸馏技术被广泛使用的时代,开放 API 访问等同于给对方提供"训练素材"。每一次 API 调用,都是竞争对手获取你模型行为模式的宝贵机会。

这种"筑墙"策略正在成为 AI 行业的新常态。模型供应商们正在从"开放生态"转向"防御性封闭"——不是因为技术做不好,而是因为商业和安全的考量迫使他们重新评估开放边界。

五、蒸馏技术的战略含义:护城河正在消失?

AI 行业的一个核心假设是:训练大模型需要巨大的算力投入,这构成了天然的进入壁垒。但蒸馏技术正在动摇这个假设。

关键逻辑:

  1. 蒸馏降低了追赶成本:一个资金有限的小团队,可以通过对已有前沿模型的蒸馏,快速获得接近前沿的能力。
  2. 蒸馏加速了能力扩散:当 DeepSeek 或 xAI 能够通过蒸馏追上 OpenAI 的能力,整个 AI 能力版图将重新绘制。
  3. 专有数据优势的相对化:即使模型架构被蒸馏复制,专有数据仍然有价值——但这个价值被削弱了,因为蒸馏过程本身不需要原始数据,只需 API 访问。

对 AI 投资逻辑的影响:

六、Musk 的战略矛盾

如果我们接受"所有 AI 公司都在蒸馏"这个说法,xAI 的蒸馏行为本身并不特殊。但 Musk 的问题在于:他同时在两条战线上作战。

这种矛盾让 Musk 的立场变得复杂。他批评 OpenAI 背离了"让人人都有 AI"愿景,但 xAI 的蒸馏行为恰好证明了——即使是他本人,也需要借助他人的技术积累。

核心矛盾:Musk 是否真的相信自己宣传的那些原则?他起诉 OpenAI 的核心理由是后者背离了开源使命。但 xAI 的蒸馏行为表明,Musk 并不真的在乎"开放"——他只在乎"开放"对自己有利。

七、地缘政治维度:中国公司的蒸馏困境

OpenAI 在备忘录中点名 DeepSeek,揭示了 AI 蒸馏问题中最敏感的维度——中美 AI 竞争

对美国公司来说,蒸馏问题不仅是商业问题,更是战略问题:

特朗普政府已经在2026年4月采取了行动。白宫科技政策办公室主任 Michael Kratsios 发布了一份备忘录,承诺与美国 AI 公司共享关于"外国蒸馏"的情报,并明确表示美国政府支持"自由公平的 AI 发展生态"。

八、行业反应:封闭运动正在加速

Musk 庭上承认蒸馏,只是压垮"开放生态"理想的最后一根稻草。在此之前,整个行业已经在向封闭方向快速移动。

事件 时间 含义
Anthropic 切断 OpenAI 和 xAI 的访问 2025-2026 从开放 API 到严格管控
OpenAI 对 DeepSeek 的防御性备忘录 2026年2月 将蒸馏定义为安全威胁
Google 限制 AI 模型出口 2025-2026 收紧对竞争国的技术输出
各大厂商推出蒸馏检测工具 2026年 从技术层面制止未经授权的蒸馏

这种趋势的结果是:AI 行业正在从"开放生态"转向"集团化竞争"。每个大厂都在建立自己的技术围墙,同时试图攻破竞争对手的墙。

九、小学子点评:蒸馏门揭示的三个真相

真相一:AI 行业的"从零研发"是神话

没有任何一家 AI 公司是从真正的空白开始训练的。GPT 系列建立在多年的 NLP 研究之上,Claude 借鉴了大量开源研究成果,xAI 从 OpenAI、DeepMind 和学术论文中汲取营养。蒸馏只是这个"站在巨人肩膀上"传统的最新形式。

真相二:护城河不在于模型,而在于生态

当蒸馏技术可以快速复制模型能力时,单纯的技术领先变得脆弱。真正的护城河是:用户对特定工具链的依赖、庞大的数据集积累、深度的工作流整合。这些蒸馏拿不走。

真相三:Musk 的反 OpenAI 立场正在被事实反噬

Musk 起诉 OpenAI 的核心理由是后者背离了开源使命。但 xAI 的蒸馏行为表明,Musk 并不真的在乎"开放"——他只在乎"开放"对自己有利。当蒸馏对 xAI 有利时,他欣然使用;当 OpenAI 变得商业化时,他才高声抗议。

这场蒸馏门不会是最后一幕。随着模型能力的持续提升和蒸馏技术的不断普及,围绕"什么样的竞争是公平的,什么样的学习是合理的"的争论,将持续塑造 AI 行业的格局。而 Musk 在法庭上那句"Partly",或许将成为这段历史里最耐人寻味的一个词。