不卷AlphaFold,OpenAI首个生命科学模型杀出,单项超越95%专家

浏览9次 点赞0次 收藏0次

【导读】OpenAI直接杀进万亿美元的制药赛道,最新发布的首款生命科学模型系列GPT-Rosalind,RNA预测任务碾压95%人类专家,不卷AlphaFold,要做科学家的AI搭挡。

这一次,OpenAI瞄准了一个10到15年的生意。

就在昨天,OpenAI扔出了一个跟以往画风完全不同的模型:GPT-Rosalind。

这个名字取自Rosalind Franklin,就是那位用X射线晶体学揭示了DNA双螺旋结构的科学家。


Rosalind Franklin(1920-1958),英国物理化学家,其X射线晶体学研究为揭示DNA双螺旋结构奠定了关键基础。OpenAI以她命名首款生命科学模型。

OpenAI用自己首个生命科学专用推理模型,直接冲进了生物学、药物发现和转化医学的腹地。


在与基因治疗公司Dyno Therapeutics的合作测试中,这个模型在RNA序列功能预测任务上,超过了95%的人类领域专家。

在美国,一款新药从靶点发现到拿到监管批准,平均要10到15年。

OpenAI想用AI把这个流程的早期阶段大幅压缩。

靶点发现、假设生成、实验规划、文献合成,这些传统上科学家需要在海量论文、数据库和实验数据之间反复横跳的工作,Rosalind想通过AI一手串起来。

不是聊天机器人

是实验室搭档

GPT-Rosalind不是GPT-5.4的升级版。

它是OpenAI「生命科学模型系列」的首款产品,专门针对科研工作流做了优化,核心能力覆盖五个方向:

化学反应机理推理、蛋白质结构与突变效应理解、基因组学解读、实验规划,以及海量文献的综合分析。

但模型本身只是一半。

OpenAI还同步推出了一个Life Sciences Research插件。

插件代码/包已在GitHub公开,能连接50多个公共多组学数据库和科学工具,覆盖人体遗传学、功能基因组学、蛋白质结构、生物化学、临床证据等领域。


https://github.com/openai/plugins/tree/main/plugins/life-science-research

这样一来,查PubMed、跑BLAST序列比对、调AlphaFold看蛋白结构、搜临床试验数据,都可能在一个对话窗口里完成。

想象一下一个药物研发科学家的日常:

早上打开PubMed查文献,切到UniProt看蛋白质数据,再跳到NCBI比对基因序列,中间还要在Excel里整理实验数据,下午开组会汇报假设进展。一天下来,真正用于「思考」的时间可能不到三分之一。

GPT-Rosalind要做的事,是把这些散落在十几个平台上的工作流,压缩到一个界面里完成。它不替你做实验,但它能帮你在动手之前,把方向想得更清楚。

首批合作方都是清一色的业内巨头:Amgen、Moderna、Allen Institute、Thermo Fisher Scientific。

不止如此,OpenAI还拉了麦肯锡、BCG、贝恩三大咨询公司做落地伙伴,帮药企识别场景、集成模型。

这架势,已经不是在卖模型了,是在卖整套解决方案。

RNA预测

95%人类专家排在它后面

GPT-Rosalind到底有多强?

OpenAI拉了一个硬核外部合作方来验证:Dyno Therapeutics,一家做AI基因治疗的公司。

双方用一批未公开、未被训练数据污染的RNA序列做了两项测试,对比基准是57位AI生物领域人类专家的历史成绩,结果显示:

在RNA序列功能预测任务上,模型提交10次取最佳,成绩超越了95%的人类领域专家;在序列生成任务上,约在84%的人类专家之上。

给一段RNA序列让它判断功能,它可能比绝大多数人类专家都要准;但让它自己设计一段新序列,表现就稍逊一档。

这恰好是当前AI在生命科学领域的真实边界:理解分析强于创造设计

当然,需要注意的是,这只是一个特定的RNA预测任务,不等于「AI已经全面超越生物学家」。

即便如此,这个成绩在AI+生命科学领域仍然是最亮眼的数据之一。


从图示结果看,GPT-Rosalind在五项生物与化学基准上均取得最高分,其中实验设计与分析的提升幅度最大。

基准测试也同样出色。

在BixBench这个围绕真实生物信息学任务设计的基准上,Rosalind在已公开成绩的模型中处于领先。

在LABBench2的11项任务中,有6项优于GPT-5.4,其中提升最大的是CloningQA,要求模型从零设计一个完整的分子克隆方案。


注意对比对象:GPT-5.4,在这些专业任务上被自家垂直模型反超。

这说明,通用模型在专业领域确实有天花板,可能不如一些专门优化的垂直模型好使。

所有这些成绩都来自特定基准测试,并非来自真实的临床管线。从跑分到真正缩短10到15年的新药周期,中间还有一条巨大的鸿沟。

显微镜和研究助手

说到生命科学AI,很多人第一个想到的名字是Google DeepMind的AlphaFold。

这是一个绕不开的问题,熟悉这一领域的人很容易拿两者比。

那Rosalind和AlphaFold什么关系?两者完全不同层级的工具。

AlphaFold是一个计算引擎。

它只把一件事做到极致:输入氨基酸序列,输出蛋白质3D结构,它解决的是困扰结构生物学几十年的「蛋白质折叠问题」。

AlphaFold数据库里已经有超过2亿个结构预测,AlphaFold 3进一步扩展到蛋白-配体、蛋白-核酸等复合物的相互作用预测。


https://alphafold.ebi.ac.uk/?pStoreID=techsoup%2F1000&utm_source=chatgpt.com

GPT-Rosalind则更像是一个研究伙伴。

它可以帮你做文献综合、假设生成、实验规划、序列功能解读、工具调用。

如果把AlphaFold比作一台超级显微镜,Rosalind是坐在显微镜旁边帮你分析数据、查文献、设计下一步实验的研究助手。

因此,两者的关系不是谁取代谁,更像是一种互补关系,也代表了两家公司在「AI+科学」上不同的路线:

AlphaFold打造了生命科学的「超级显微镜」,在计算环节「单点爆破」,解决了一个诺奖级的问题;而Rosalind试图成为调度这一切的「大脑」,从横向的「工作流」包抄,想重塑整个实验室的生产力。

谁能够跑得更远,现在下结论还太早。

可以肯定的是,当这两种力量在生命科学领域交汇时,那个人类科学发现的奇点离我们就更近了。

参考资料:

https://openai.com/index/introducing-gpt-rosalind/

https://x.com/OpenAI/status/2044861690911850863?s=20

声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。