不卷AlphaFold，OpenAI首个生命科学模型杀出，单项超越95%专家

2026-04-18 发布浏览1131次点赞0次收藏0次

【导读】OpenAI直接杀进万亿美元的制药赛道，最新发布的首款生命科学模型系列GPT-Rosalind，RNA预测任务碾压95%人类专家，不卷AlphaFold，要做科学家的AI搭挡。

这一次，OpenAI瞄准了一个10到15年的生意。

就在昨天，OpenAI扔出了一个跟以往画风完全不同的模型：GPT-Rosalind。

这个名字取自Rosalind Franklin，就是那位用X射线晶体学揭示了DNA双螺旋结构的科学家。

Rosalind Franklin（1920-1958），英国物理化学家，其X射线晶体学研究为揭示DNA双螺旋结构奠定了关键基础。OpenAI以她命名首款生命科学模型。

OpenAI用自己首个生命科学专用推理模型，直接冲进了生物学、药物发现和转化医学的腹地。

在与基因治疗公司Dyno Therapeutics的合作测试中，这个模型在RNA序列功能预测任务上，超过了95%的人类领域专家。

在美国，一款新药从靶点发现到拿到监管批准，平均要10到15年。

OpenAI想用AI把这个流程的早期阶段大幅压缩。

靶点发现、假设生成、实验规划、文献合成，这些传统上科学家需要在海量论文、数据库和实验数据之间反复横跳的工作，Rosalind想通过AI一手串起来。

不是聊天机器人

是实验室搭档

GPT-Rosalind不是GPT-5.4的升级版。

它是OpenAI「生命科学模型系列」的首款产品，专门针对科研工作流做了优化，核心能力覆盖五个方向：

化学反应机理推理、蛋白质结构与突变效应理解、基因组学解读、实验规划，以及海量文献的综合分析。

但模型本身只是一半。

OpenAI还同步推出了一个Life Sciences Research插件。

插件代码/包已在GitHub公开，能连接50多个公共多组学数据库和科学工具，覆盖人体遗传学、功能基因组学、蛋白质结构、生物化学、临床证据等领域。

https://github.com/openai/plugins/tree/main/plugins/life-science-research

这样一来，查PubMed、跑BLAST序列比对、调AlphaFold看蛋白结构、搜临床试验数据，都可能在一个对话窗口里完成。

想象一下一个药物研发科学家的日常：

早上打开PubMed查文献，切到UniProt看蛋白质数据，再跳到NCBI比对基因序列，中间还要在Excel里整理实验数据，下午开组会汇报假设进展。一天下来，真正用于「思考」的时间可能不到三分之一。

GPT-Rosalind要做的事，是把这些散落在十几个平台上的工作流，压缩到一个界面里完成。它不替你做实验，但它能帮你在动手之前，把方向想得更清楚。

首批合作方都是清一色的业内巨头：Amgen、Moderna、Allen Institute、Thermo Fisher Scientific。

不止如此，OpenAI还拉了麦肯锡、BCG、贝恩三大咨询公司做落地伙伴，帮药企识别场景、集成模型。

这架势，已经不是在卖模型了，是在卖整套解决方案。

RNA预测

95%人类专家排在它后面

GPT-Rosalind到底有多强？

OpenAI拉了一个硬核外部合作方来验证：Dyno Therapeutics，一家做AI基因治疗的公司。

双方用一批未公开、未被训练数据污染的RNA序列做了两项测试，对比基准是57位AI生物领域人类专家的历史成绩，结果显示：

在RNA序列功能预测任务上，模型提交10次取最佳，成绩超越了95%的人类领域专家；在序列生成任务上，约在84%的人类专家之上。

给一段RNA序列让它判断功能，它可能比绝大多数人类专家都要准；但让它自己设计一段新序列，表现就稍逊一档。

这恰好是当前AI在生命科学领域的真实边界：理解分析强于创造设计。

当然，需要注意的是，这只是一个特定的RNA预测任务，不等于「AI已经全面超越生物学家」。

即便如此，这个成绩在AI+生命科学领域仍然是最亮眼的数据之一。

从图示结果看，GPT-Rosalind在五项生物与化学基准上均取得最高分，其中实验设计与分析的提升幅度最大。

基准测试也同样出色。

在BixBench这个围绕真实生物信息学任务设计的基准上，Rosalind在已公开成绩的模型中处于领先。

在LABBench2的11项任务中，有6项优于GPT-5.4，其中提升最大的是CloningQA，要求模型从零设计一个完整的分子克隆方案。

注意对比对象：GPT-5.4，在这些专业任务上被自家垂直模型反超。

这说明，通用模型在专业领域确实有天花板，可能不如一些专门优化的垂直模型好使。

所有这些成绩都来自特定基准测试，并非来自真实的临床管线。从跑分到真正缩短10到15年的新药周期，中间还有一条巨大的鸿沟。

显微镜和研究助手

说到生命科学AI，很多人第一个想到的名字是Google DeepMind的AlphaFold。

这是一个绕不开的问题，熟悉这一领域的人很容易拿两者比。

那Rosalind和AlphaFold什么关系？两者完全不同层级的工具。

AlphaFold是一个计算引擎。

它只把一件事做到极致：输入氨基酸序列，输出蛋白质3D结构，它解决的是困扰结构生物学几十年的「蛋白质折叠问题」。

AlphaFold数据库里已经有超过2亿个结构预测，AlphaFold 3进一步扩展到蛋白-配体、蛋白-核酸等复合物的相互作用预测。

https://alphafold.ebi.ac.uk/?pStoreID=techsoup%2F1000&utm_source=chatgpt.com

GPT-Rosalind则更像是一个研究伙伴。

它可以帮你做文献综合、假设生成、实验规划、序列功能解读、工具调用。

如果把AlphaFold比作一台超级显微镜，Rosalind是坐在显微镜旁边帮你分析数据、查文献、设计下一步实验的研究助手。

因此，两者的关系不是谁取代谁，更像是一种互补关系，也代表了两家公司在「AI+科学」上不同的路线：

AlphaFold打造了生命科学的「超级显微镜」，在计算环节「单点爆破」，解决了一个诺奖级的问题；而Rosalind试图成为调度这一切的「大脑」，从横向的「工作流」包抄，想重塑整个实验室的生产力。

谁能够跑得更远，现在下结论还太早。

可以肯定的是，当这两种力量在生命科学领域交汇时，那个人类科学发现的奇点离我们就更近了。

参考资料：

https://openai.com/index/introducing-gpt-rosalind/

https://x.com/OpenAI/status/2044861690911850863?s=20

Google Go 测试数据库 OpenAI AI GPT

声明：本文转载自新智元，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里查看更多信息！

不卷AlphaFold，OpenAI首个生命科学模型杀出，单项超越95%专家

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。