你天天用的Claude和Codex,Meta内部不让随便用了

浏览15次 点赞0次 收藏0次

【导读】你每天用Codex、Claude Code写代码,从没想过一个问题:这份聪明,到底算谁的?

今年5月,Meta给自家工程师划了一道红线。

应用AI工程部门的人,不能再随便用Claude Code和Codex了。


据The Information拿到的内部指南,一份备忘录甚至直接要求,暂停某些用到这两个模型的任务。文件措辞很重,说这可能触发「与合作方的严重升级」。

然而,反常也就反常在这儿。

Meta是Claude Code在全球最大的客户之一。它今年内部用AI的总账单,正奔着数十亿美元去。

天天离不开的工具,公司花大钱买来,现在却在内部限制使用。而限制的理由,你大概也想不到。

不是它们不好用。恰恰相反,是太好用了。

这条红线

现在仍在生效

据The Information报道,这套限制5月就定下,至今仍在生效。

Meta为何如此紧张,这要从它内部一个AI编程助手项目说起。

今年,它组建了一个应用AI工程团队,主攻自研的AI编程助手MetaCode(原名DevMate)。

目标就是别再让Meta花大价钱继续使用别人的AI编程模型,自己也要训一个出来。


Claude Code官方界面。它与OpenAI的Codex,已是职业开发者做智能体编程的事实标准。

可要练出一个会写代码的模型,没那么简单。

你得喂给它海量高质量数据,还得出足够多、足够刁钻的编程题,让它练手、给它判分。这套题库和评测,几乎决定了一个编程模型最终有多强。

但问题恰恰出在这儿。

Meta遇到的难题,是怎样才能不让员工太过依赖这些外部工具,去打造内部的替代品。

它所担心的,是这些外部模型的输出渗进训练数据,让自己造的模型,偷偷学了对手的本事。

要看懂这层担心,得先知道一个模型是怎么「学」的:你喂给它什么样的数据,它就长成什么样子。

MetaCode想变强,靠的就是工程师攒的那套训练数据和编程题库。

可一旦这些题目、答案、甚至判分标准出自Claude或Codex,MetaCode学到的,就不再是「人类工程师训练出来的本事」,而是「Claude的本事」。

它照着对手的卷子抄答案,越练越像对手。

更隐蔽的,是评测这一环。

模型每答一道题,得有个东西告诉它答得好不好,它才知道往哪儿改。

如果出题和判分都交给Codex,那MetaCode就是在朝着「Codex觉得对」的方向进化,等于把对手的判断标准,一点点复刻进了自己脑子里。

这就是为什么,Meta的这份指南不让AI当出题人、判卷人,连「AI生成的材料能不能进被测模型读得到的环境」都要管。

只要对手的输出有一丝渗进训练或评测的链条,这条「谁教会了谁」的界线,就糊了。

说到底,Meta暂停部分任务,是在给训练数据做隔离。

怕的是AI写得太好,分不清哪些本事是自己训练出来的,哪些是从Claude和Codex那儿学习来的。

而后面这层能力,是租来的,并不是自己的。

细到让人意外的限制

要先说清楚,Meta的内部文件里,并没有任何员工真违规的记录。

Meta发言人也回应,公司有「明确的政策」规范怎么用AI工具。所以这份文件,更像是在内部提前拉响警报。

哪些活不能让AI碰?主要是以下三类:

第一,不能拿Claude或Codex的输出,去给自家模型出测试题。指南的原话是,这「明确属于工程师不在驾驶位的范畴」,「我们不要源自模型的任务」。

第二,不能让AI在源码里找bug,也不能让它基于代码分析帮你想「该测什么」。

第三,AI生成的任何东西,都不能放进被测模型能访问到的地方。

说白了,只要AI参与了「该测什么、答得对不对」的判断,对手的本事就可能混进来。三条堵的都是这个口子。

哪些活还能让AI干?

搭工作流、整理代码和文件、给内部工具搭测试的架子,这些日常杂活可以。指南把这类工作称作「测试脚手架(test scaffolding)」和「方案校准(solution calibration)」,说白了就是打下手、搭框架。

哪怕是这些活,也有一条铁律:AI的每一行产出,人都得先过一遍眼。

在Meta看来,一旦让对手的模型来出题、判卷,这场考试就说不清是谁考出来的了。

它真正想守住的,就是那条「谁教会了谁」的界线。

绕不开的「蒸馏陷阱」

Meta担心的这件事,业内有个专门名词:蒸馏(distillation)。

意思不难懂:拿一个更强的模型,让它不停答题,再用这些答案去训练一个较弱的模型。

有点像让学霸把卷子从头做一遍,学渣照着抄,几个月就追上人家好几年的功力。

别人在数据、算力、研究上砸的天价投入,你近乎免费蹭走。

从零训一个前沿模型,烧的钱和时间是天文数字。而蒸馏,可能只要对方一批输出,成本和工期都砍到零头。

蒸馏本身是业界常规操作,大厂也常拿自家大模型蒸馏出更小、更便宜的版本给用户用。

麻烦只在于:一旦你抄的是别人家的模型,你训出来的能力,到底是自己练的,还是顺来的?说不清。

有人把这叫「蒸馏陷阱」:你越是靠最强的模型去搭自己的地基,就越难证明,你的聪明到底打哪来。


在美国,法律并未明文禁止蒸馏,AI生成的内容也不受版权保护。你拿对方的输出去练自己的模型,法律这一关基本拦不住。

唯一的关卡是合同。

OpenAI、Anthropic的服务条款都写了类似的限制:不许拿模型的输出,去造一个跟自己竞争的东西。

而且这道关卡,执法权全在竞争对手手里。

去年,Anthropic就直接掐断了OpenAI对Claude的接口(API)访问,哪怕OpenAI说自己只是拿来评测能力和安全性,是「行业标准」做法。

就连马斯克,也在今年4月的一场庭审上被迫承认,他的xAI「部分」蒸馏过OpenAI的模型。


2026年4月30日,在加州联邦法院的证人席上,马斯克被问到xAI是否对OpenAI模型用了蒸馏技术来训练Grok,他先称这是AI公司的普遍做法。

当被追问这是否等于「是」时,他回答是「部分」。

规则模糊,「执法权」都攥在竞争对手手里。谁敢拿自己几十亿的投入,去赌对手不翻脸。

从这个角度看,Meta的紧张,一点都不多余。

这里,还有一个算盘就是省钱。

按内部备忘录,Meta今年光内部用AI这一项,就要烧掉数十亿美元。它甚至开始给员工的token用量设上限。财大气粗如Meta,也开始嫌AI太贵、要精打细算了。

如果能把开发工作从昂贵的外部工具转到自家MetaCode上,既省了钱,又躲开了蒸馏的雷,可谓一举两得。

一张走钢丝的地图

关于Meta这套内部文件,科技法学者、法律顾问Mark Leiser有一句话很形象:这「几乎就是一张走钢丝的地图」。

一边要获得外部模型的好处,一边又得防着它的本事溜进自家系统。

像这样走钢丝的,当然不止Meta一家公司,它戳中的是整个行业的命门。

当你用一个足够聪明的AI,去造另一个同样聪明的AI,到最后,你可能很难说清:这份聪明,究竟是你自己练出来的,还是从别人的AI那儿悄悄学来的。

而且这事,离普通人也没那么远。

你用AI写的代码、改的方案、攒的资料,喂回去又会变成下一代模型的养料。

在这个循环中,谁站在谁的肩膀上,那条界线已经变得越来越糊。

当AI开始帮我们造AI,我们还分得清,本事到底是谁的吗?

参考资料:

https://x.com/kimmonismus/status/2071591755351224344

https://www.theinformation.com/articles/internal-docs-show-meta-putting-limits-claude-codex-fearing-distillation

编辑:元宇


声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它往往能得到较好的回响。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。
最新资讯