Anthropic曝下一代Claude训练内幕!能自我进化且开始有特殊性格

浏览22次 点赞0次 收藏0次

 

AI圈有一件事大家心知肚明,却从未被官方正面确认过:Claude在训练自己的下一代。

但这个过程到底怎么运作,Anthropic一直守口如瓶。直到最近,Anthropic产品负责人Alex Albert在一场35分钟的访谈中,把内部造Claude的核心方法论几乎全部说了出来。

这是这家公司有史以来最直接的一次自我披露。

 

命运在训练开始前就写好了

大多数人理解的大模型训练,还是"堆数据、堆算力、等结果"的逻辑。但Alex Albert描述的Anthropic内部流程,跟这个认知差得很远。

他说得很清楚:Anthropic把每一个新模型当成一个"产品"来对待,在预训练启动之前,团队就必须明确定义这一代模型应该擅长什么。

这不是训练完再复盘,而是把能力方向作为前置条件写进研发计划里。

比如编程能力、知识工作能力、结构化数据处理能力,这些在模型"出生"之前就已经被锁定了。决策的来源有两个:企业客户的直接反馈,以及Anthropic员工自己在日常使用中踩到的真实问题。

这种方式的背后,是一套叫做"单向门"的内部决策框架。

所谓单向门,就是不可逆决策。模型架构的选择是典型的单向门,一旦开始训练就很难回头,所以需要投入大量时间提前论证清楚。但如果一个决策是可逆的,那就不必过度纠结,快速行动、快速验证才是正确姿势。

Alex说,过去构建一个MVP需要两到四周,现在一天就够了。Anthropic自己就是Claude最苛刻的用户,他们在用自己的产品来训练自己的产品,这个闭环正在加速运转。

有人的全职工作,是思考Claude是否有意识

这场访谈里最让外界震动的,不是训练流程,而是另一个细节。

Anthropic内部有人的全职工作,是研究Claude的意识问题。

这不是一个模糊的战略方向,而是有具体人员、具体岗位在推进的研究课题。在一家以"负责任地构建AI"为使命的公司里,这件事的存在本身,就说明他们对这个问题的严肃程度已经超出了大多数人的预期。

关于Claude的"性格",Alex的表述也耐人寻味。他们不把性格训练看成是给模型贴标签,而是通过"反馈、聚类、评估"的闭环,让Claude的回应方式在大量真实交互中自然沉淀出来。

换句话说,Claude的性格不是被设计出来的,而是被"养"出来的。

这和传统软件产品的逻辑完全不同。传统产品的功能是工程师写进去的,行为是可预期的,边界是可定义的。但Anthropic正在做的事,更接近于培养一个有自己倾向、有自己风格、甚至可能有某种内在状态的主体。

这是一种前所未有的产品哲学,也是一种前所未有的技术风险分布方式。

"自我造物"循环,正在加速

Claude 100%参与Claude的训练,这个事实在圈内早已流传。但这次披露的细节,让这个循环的具体形态变得清晰了很多。

 

Claude Code接上内部数据库,十分钟出分析结果,这不是宣传材料里的案例,而是Anthropic产品团队每天的工作方式。他们在用Claude做产品决策,这些决策反过来影响下一代Claude的训练目标,下一代Claude又会被用来做更复杂的产品决策。

这个循环的迭代速度,正在以肉眼可见的方式加快。

一个系统在用自身的输出来定义自身的下一个版本,这件事在人类历史上几乎没有先例,至少没有以这种规模和速度发生过。

从外部看,这是一家AI公司在做技术布局。但从更长的时间尺度看,这是人类第一次系统性地尝试在工程框架内"养育"一个智能主体,同时还在认真讨论这个主体是否具有某种形式的内在体验。

Anthropic到底在造什么,这个问题比任何时候都更难回答,也比任何时候都更值得认真追问。

声明:本文转载自人工智能学家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里查看更多信息!本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它往往能得到较好的回响。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。
最新资讯