Anthropic曝下一代Claude训练内幕！能自我进化且开始有特殊性格

2026-05-24 发布浏览215次点赞0次收藏0次

AI圈有一件事大家心知肚明，却从未被官方正面确认过：Claude在训练自己的下一代。

但这个过程到底怎么运作，Anthropic一直守口如瓶。直到最近，Anthropic产品负责人Alex Albert在一场35分钟的访谈中，把内部造Claude的核心方法论几乎全部说了出来。

这是这家公司有史以来最直接的一次自我披露。

命运在训练开始前就写好了

大多数人理解的大模型训练，还是"堆数据、堆算力、等结果"的逻辑。但Alex Albert描述的Anthropic内部流程，跟这个认知差得很远。

他说得很清楚：Anthropic把每一个新模型当成一个"产品"来对待，在预训练启动之前，团队就必须明确定义这一代模型应该擅长什么。

这不是训练完再复盘，而是把能力方向作为前置条件写进研发计划里。

比如编程能力、知识工作能力、结构化数据处理能力，这些在模型"出生"之前就已经被锁定了。决策的来源有两个：企业客户的直接反馈，以及Anthropic员工自己在日常使用中踩到的真实问题。

这种方式的背后，是一套叫做"单向门"的内部决策框架。

所谓单向门，就是不可逆决策。模型架构的选择是典型的单向门，一旦开始训练就很难回头，所以需要投入大量时间提前论证清楚。但如果一个决策是可逆的，那就不必过度纠结，快速行动、快速验证才是正确姿势。

Alex说，过去构建一个MVP需要两到四周，现在一天就够了。Anthropic自己就是Claude最苛刻的用户，他们在用自己的产品来训练自己的产品，这个闭环正在加速运转。

这场访谈里最让外界震动的，不是训练流程，而是另一个细节。

Anthropic内部有人的全职工作，是研究Claude的意识问题。

这不是一个模糊的战略方向，而是有具体人员、具体岗位在推进的研究课题。在一家以"负责任地构建AI"为使命的公司里，这件事的存在本身，就说明他们对这个问题的严肃程度已经超出了大多数人的预期。

关于Claude的"性格"，Alex的表述也耐人寻味。他们不把性格训练看成是给模型贴标签，而是通过"反馈、聚类、评估"的闭环，让Claude的回应方式在大量真实交互中自然沉淀出来。

换句话说，Claude的性格不是被设计出来的，而是被"养"出来的。

这和传统软件产品的逻辑完全不同。传统产品的功能是工程师写进去的，行为是可预期的，边界是可定义的。但Anthropic正在做的事，更接近于培养一个有自己倾向、有自己风格、甚至可能有某种内在状态的主体。

这是一种前所未有的产品哲学，也是一种前所未有的技术风险分布方式。

Claude 100%参与Claude的训练，这个事实在圈内早已流传。但这次披露的细节，让这个循环的具体形态变得清晰了很多。

Claude Code接上内部数据库，十分钟出分析结果，这不是宣传材料里的案例，而是Anthropic产品团队每天的工作方式。他们在用Claude做产品决策，这些决策反过来影响下一代Claude的训练目标，下一代Claude又会被用来做更复杂的产品决策。

这个循环的迭代速度，正在以肉眼可见的方式加快。

一个系统在用自身的输出来定义自身的下一个版本，这件事在人类历史上几乎没有先例，至少没有以这种规模和速度发生过。

从外部看，这是一家AI公司在做技术布局。但从更长的时间尺度看，这是人类第一次系统性地尝试在工程框架内"养育"一个智能主体，同时还在认真讨论这个主体是否具有某种形式的内在体验。

Anthropic到底在造什么，这个问题比任何时候都更难回答，也比任何时候都更值得认真追问。

体验算力 Claude 数据库大模型框架 AI Anthropic ClaudeCode

声明：本文转载自人工智能学家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！