AI 中文社/资讯/详情

OpenAI首席科学家Nature爆料：AI自主发现新科学！世界模型和RL是关键

2025-05-13 发布 · 浏览10次 · 点赞0次 · 收藏0次

【导读】近日，《自然》杂志独家专访了OpenAI首席科学家Jakub Pachocki，他揭示了推理模型、强化学习如何赋予AI自主发现科学的能力，并分享了AI如何在五年内重塑科学研究与经济格局的雄心。

ChatGPT推出后，迅速震惊了全球。

自那以后，OpenAI一直站在AI技术发展的最前沿。

去年9月，他们推出o系列模型，再次引领AI推理的浪潮。

到今天，推理模型已成主流。

最新、最强的模型，比如o3、Gemini 2.5 Pro、DeepSeek-R1，都是推理模型。

这些模型可以通过思维链（CoT），一步一步地「思考」来解决问题。比如，帮助研究人员润色文章、编写代码、回顾文献，甚至是提出假设。

可以说，OpenAI的迅速崛起极大推动了这次的AI革命。

在这其中，有个人一直在OpenAI扮演着关键角色。虽然很少有人听说过他。

这就是OpenAI的首席科学家Jakub Pachocki。

2024年以来，Jakub Pachocki一直是OpenAI的首席科学家

Pachocki在2017年从学术界加入到OpenAI。在此之前，他是一名理论计算机科学家和竞技程序员。

现在，Pachocki领导一项最先进的AI系统开发，这些系统旨在解决科学、数学和编程中的复杂任务。

就在昨天，《自然》杂志对Pachocki做了一次专访，探讨了AI能否做出独立研究、通用人工智能（AGI），及公司即将推出的开源模型等热门话题。

文章地址：https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809

以下是采访精彩对话。

推理模型有多重要？

现在，你能和一个AI对话，但它还只是个需要不断被引导的助手。

我（Pachocki，下同）觉得接下来这种情况会有很大改变。

我们已经看到，像OpenAI的Deep Research这种AI工具，可以在没有人监督的情况下持续工作10到20分钟，给出一份有用的结果。

但是，目前用于解决这些需求的计算量还不大。

强化学习有多重要？

第一阶段的ChatGPT版本涉及一个无监督的预训练阶段。在这个阶段，模型会吞下海量的数据，并构建出某种「世界模型」。

然后，我们通过使用人类反馈的强化学习，训练出一个有用的AI助手。

最近在推理模型上的进展，可以看作是更加重视强化学习的结果。

这样，我们就不只是在提取知识，还使模型能够找到自己的思考方式。

一个问题是，我们是否应该继续将这些学习阶段分开来考虑。

推理模型不是在真空中学习如何思考的，它们根植于一个预训练模型。

我的很多关注点在于如何将模型的不同阶段、方法结合起来，理解它们之间的相互作用。

模型真的会思考吗？

首先，我们需要清楚，AI的运行方式与人脑不同。

预训练的模型学到了一些关于世界的知识，但它并没有真正理解它是如何学会这些事情的，也搞不清它学习这些事情的时间顺序。

但我坚信我们有充分的证据表明模型能够发现新科学。

我会说这是一种「推理」，但这并不意味着它跟人类的推理方式一样。

在探索AI推理能力的同时，OpenAI也在考虑如何通过开源模型推动科学进步。

奥特曼说的新开源模型

对于这个问题，我特别兴奋。尤其是能给研究人员提供一个开源的模型权重（他们可以下载并进一步训练）。

随着这些模型变得越来越强大，我们越来越有责任去理解在不同的方式下部署它们会如何影响大家。

我觉得要发布顶尖的前沿模型并开源权重会很困难，因为有安全方面的顾虑。

我想我们（OpenAI）发布的模型得比现有的开源模型更好。

AGI的定义是什么？何时达到？

我对AGI的定义及时间预期都发生了很大的变化。

刚进研究生院时，我觉得AGI的一个里程碑是能精通围棋，得花上几十年的时间。

结果，2016年这个目标就实现了。这对我来说简直是震撼世界的时刻。

2017年加入OpenAI时，我还是公司里对AGI最大的质疑者之一，但新的突破接踵而来。

在图灵测试上，我们已经取得了很多的进展。数学和问题的解决能力也进步很快，我觉得最难的基准测试也会很快被突破。

所以，我现在思考的下一个重大里程碑——是AI能产生实实在在、可量化的经济影响，特别是能够创造全新的科学研究。

这对我来说是最接近我心目中AGI的感觉。我们现在正聚焦于此，我预计在5年内会有非常大的进展。今年，人工智能可能还不会解决主要的科学问题，但几乎可以自主地编写有价值的软件。

据报道，微软和OpenAI已同意使用经济指标来衡量AGI的进展，具体目标是实现1000亿美元的投资回报。这种方式与Pachocki定义的AGI相匹配。

Pachocki的愿景表明，AI不仅将成为科学研究的助手，更可能在未来五年内重塑全球经济与创新格局。

参考资料：

https://www.nature.com/articles/d41586-025-01485-2?utm_source=x&utm_medium=social&utm_campaign=nature&linkId=14414809

ChatGPT AGI 话题训练模型 OpenAI AI工具 AI技术 GPT 程序员人工智能微软测试 AI

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里。

浏览(10) 点赞(0) 收藏(0)

0条评论

珍惜第一个评论，它能得到比较好的回应。

游客

登录后再评论

鸟过留鸣，人过留评。
和谐社区，和谐点评。

OpenAI首席科学家Nature爆料：AI自主发现新科学！世界模型和RL是关键

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

OpenAI首席科学家Nature爆料：AI自主发现新科学！世界模型和RL是关键

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。