OpenAI首席科学家Nature爆料:AI自主发现新科学!世界模型和RL是关键

2025-05-13 发布 · 浏览10次 · 点赞0次 · 收藏0次

【导读】近日,《自然》杂志独家专访了OpenAI首席科学家Jakub Pachocki,他揭示了推理模型、强化学习如何赋予AI自主发现科学的能力,并分享了AI如何在五年内重塑科学研究与经济格局的雄心。

ChatGPT推出后,迅速震惊了全球。

自那以后,OpenAI一直站在AI技术发展的最前沿。

去年9月,他们推出o系列模型,再次引领AI推理的浪潮。

到今天,推理模型已成主流。

最新、最强的模型,比如o3、Gemini 2.5 Pro、DeepSeek-R1,都是推理模型。

这些模型可以通过思维链(CoT),一步一步地「思考」来解决问题。比如,帮助研究人员润色文章、编写代码、回顾文献,甚至是提出假设。

可以说,OpenAI的迅速崛起极大推动了这次的AI革命。

在这其中,有个人一直在OpenAI扮演着关键角色。虽然很少有人听说过他。

这就是OpenAI的首席科学家Jakub Pachocki。


2024年以来,Jakub Pachocki一直是OpenAI的首席科学家

Pachocki在2017年从学术界加入到OpenAI。在此之前,他是一名理论计算机科学家和竞技程序员。

现在,Pachocki领导一项最先进的AI系统开发,这些系统旨在解决科学、数学和编程中的复杂任务。

就在昨天,《自然》杂志对Pachocki做了一次专访,探讨了AI能否做出独立研究、通用人工智能(AGI),及公司即将推出的开源模型等热门话题。


文章地址:https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809

以下是采访精彩对话。

推理模型有多重要?

现在,你能和一个AI对话,但它还只是个需要不断被引导的助手。

我(Pachocki,下同)觉得接下来这种情况会有很大改变。

我们已经看到,像OpenAI的Deep Research这种AI工具,可以在没有人监督的情况下持续工作10到20分钟,给出一份有用的结果。

但是,目前用于解决这些需求的计算量还不大。

强化学习有多重要?

第一阶段的ChatGPT版本涉及一个无监督的预训练阶段。在这个阶段,模型会吞下海量的数据,并构建出某种「世界模型」。

然后,我们通过使用人类反馈的强化学习,训练出一个有用的AI助手。

最近在推理模型上的进展,可以看作是更加重视强化学习的结果。

这样,我们就不只是在提取知识,还使模型能够找到自己的思考方式。

一个问题是,我们是否应该继续将这些学习阶段分开来考虑。

推理模型不是在真空中学习如何思考的,它们根植于一个预训练模型。

我的很多关注点在于如何将模型的不同阶段、方法结合起来,理解它们之间的相互作用。

模型真的会思考吗?

首先,我们需要清楚,AI的运行方式与人脑不同。

预训练的模型学到了一些关于世界的知识,但它并没有真正理解它是如何学会这些事情的,也搞不清它学习这些事情的时间顺序。

但我坚信我们有充分的证据表明模型能够发现新科学

我会说这是一种「推理」,但这并不意味着它跟人类的推理方式一样。

在探索AI推理能力的同时,OpenAI也在考虑如何通过开源模型推动科学进步。

奥特曼说的新开源模型

对于这个问题,我特别兴奋。尤其是能给研究人员提供一个开源的模型权重(他们可以下载并进一步训练)。

随着这些模型变得越来越强大,我们越来越有责任去理解在不同的方式下部署它们会如何影响大家。

我觉得要发布顶尖的前沿模型并开源权重会很困难,因为有安全方面的顾虑。

我想我们(OpenAI)发布的模型得比现有的开源模型更好。

AGI的定义是什么?何时达到?

我对AGI的定义及时间预期都发生了很大的变化。

刚进研究生院时,我觉得AGI的一个里程碑是能精通围棋,得花上几十年的时间。

结果,2016年这个目标就实现了。这对我来说简直是震撼世界的时刻。

2017年加入OpenAI时,我还是公司里对AGI最大的质疑者之一,但新的突破接踵而来。

在图灵测试上,我们已经取得了很多的进展。数学和问题的解决能力也进步很快,我觉得最难的基准测试也会很快被突破。

所以,我现在思考的下一个重大里程碑——是AI能产生实实在在、可量化的经济影响,特别是能够创造全新的科学研究

这对我来说是最接近我心目中AGI的感觉。我们现在正聚焦于此,我预计在5年内会有非常大的进展。今年,人工智能可能还不会解决主要的科学问题,但几乎可以自主地编写有价值的软件。

据报道,微软和OpenAI已同意使用经济指标来衡量AGI的进展,具体目标是实现1000亿美元的投资回报。这种方式与Pachocki定义的AGI相匹配。

Pachocki的愿景表明,AI不仅将成为科学研究的助手,更可能在未来五年内重塑全球经济与创新格局。

参考资料:

https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809

OpenAI首席科学家Nature爆料:AI自主发现新科学!世界模型和RL是关键 - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论

游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。