击败95%人类专家！OpenAI生命科学模型GPT‑Rosalind进入新药发现快车道

张开发

• 2026/5/6 12:36:10 • 15 分钟阅读

分享文章

击败95%人类专家！OpenAI生命科学模型GPT‑Rosalind进入新药发现快车道

生命科学研究浩如烟海的文献与无止境的试错消耗着一代代研究者的精力。OpenAI为生命科学研究打造的GPT-Rosalind正式亮相。这款深度理解化学和基因组学、直接连通数十种科研工具的AI模型正试图将长达十几年的新药研发长征缩短它在专业测试中击败了人类专家而且已悄然进入全球顶尖药企的研发一线。打破新药研发的时钟一款新药从最初的靶点发现一路走到获得监管部门的最终批准平均需要耗费10到15年的漫长岁月。这个周期里填满了枯燥且极具挑战的案头与实验室工作。早期发现阶段取得的任何微小进展都会在后续漫长的流程中产生巨大的复利效应。选准了靶点提出了有力的生物学假设设计了高质量的初步实验后期临床试验的失败率就会大幅降低。生命科学领域的进展之所以缓慢底层科学问题本身的深奥是其一更在于研究工作流的极度复杂性。科学家每天都要面对浩如烟海的学术文献、结构各异的专用数据库以及庞杂的实验数据。他们必须在这些极度分散的信息碎片中不断提出假设并加以验证。这些传统的工作流耗时极长呈现出高度碎片化的特征极难实现规模化运作。先进的AI系统完全有能力协助研究人员加快工作节奏。系统能提升现有工作的处理效率更能引导科学家去探索未知的可能性。那些容易被人类大脑遗漏的隐蔽联系会在模型的梳理下清晰地浮出水面帮助研究团队更早地确立可靠的科研假设。通过全面支持证据合成、假设生成、实验规划等多步骤的繁杂任务这款新模型致力于加速新药研发的早期进程。假以时日这些智能系统将助力生命科学机构实现从前难以想象的重大突破大幅提高药物研发的成功率。GPT-Rosalind这款模型的名字致敬了伟大的女科学家罗莎琳德·富兰克林。她当年严谨务实的研究工作为揭示DNA脱氧核糖核酸的双螺旋结构提供了关键证据为现代分子生物学奠定了坚实的基石。跑分超越专家的底气作为专为现代科学工作量身定制的工具GPT-Rosalind系列模型能够熟练处理已发表的科学证据、实验数据和专业工具。在内部评估中它在处理分子、蛋白质、基因、生物通路以及疾病相关生物学推理任务时表现优异。研发团队评估了该模型在基础科学发现和工业研究领域的各项核心能力。这些测试全面衡量了模型在不同科学分支下的推理水平涵盖化学反应机制、蛋白质结构与突变效应分析、蛋白质相互作用以及DNA序列的系统发育解释。测试体系还着重考察了模型能否真正支撑实际的科研工作流。模型需要准确解释复杂的实验输出结果识别出只有深耕多年的领域专家才能敏锐察觉的隐蔽模式并综合外部信息来规划后续的跟进实验。评估标准还要求模型准确选择并使用合适的计算工具、数据库和特定领域功能以此来辅助自身的逻辑推理。综合来看模型在科学研究的端到端全流程中取得了显著进步展现出协助研究人员攻克高难度发现任务的强大实力。展示了模型在核心生物和化学基准测试中的全面提升。在行业评估环节一系列高难度的公开基准测试进一步验证了它的能力。在专门针对真实生物信息学和数据分析任务设计的BixBench基准测试中GPT-Rosalind在所有公布成绩的模型中稳居榜首。在衡量各项研究任务表现的LABBench2基准测试中任务范围涵盖文献检索、数据库访问、序列操作和实验方案设计。在总共11项任务中GPT-Rosalind有6项成绩超越了GPT-5.4。提升最显著的是CloningQA任务这项任务要求模型端到端地设计分子克隆方案所需的DNA和酶试剂对准确度的要求极高。研发团队还与致力于AI设计基因疗法的Dyno Therapeutics公司展开合作使用从未公开且未被污染的序列数据测试模型在RNA序列到功能预测及生成任务上的表现。模型的成绩与AI生物领域的57个历史人类专家得分进行了正面较量。在Codex应用中直接进行评估时模型十次提交中的最佳成绩在预测任务上击败了95%的人类专家在序列生成任务上击败了84%的人类专家。科学家每天都需要生成证据、分析复杂数据并得出经得起推敲的生物学结论这些扎实的评估数据为模型在真实科研工作流中的表现提供了极具价值的参考。五十个工具与访问、治理防线为了让科学家用得顺手平台在GitHub上发布了全新的生命科学研究插件供Codex用户免费使用。https://github.com/openai/plugins/tree/main/plugins/life-science-research这个资源包内含丰富的模块化技能覆盖了大部分常见的科研工作流旨在帮助用户顺畅处理人类遗传学、功能基因组学、蛋白质结构、生物化学、临床证据以及公共研究发现等多个领域的棘手任务。这些技能模块充当着指挥调度的角色协助科学家更高效地解答那些范围宽泛、边界模糊且需要多步拆解的复杂问题。该插件彻底打通了50多个公共多组学数据库、文献来源和生物学工具的访问权限为蛋白质结构查找、序列搜索、文献综述和公共数据集发现等日常重复性工作流提供了一个灵活便捷的启动平台。符合条件的企业用户可以在研究工作流中结合GPT-Rosalind使用此插件进行深度的生物学推理普通用户也可以在主线模型中调用这个强大的插件包。研发团队希望把这些强大的能力交到那些最有可能增进人类健康福祉的科学家手中同时必须建立坚固的防线严防生物技术的意外滥用。生命科学模型目前通过受信任的访问部署架构启动初期仅面向美国本土符合条件的企业客户开放在资格审查、访问管理和组织治理方面设置了最严格的控制措施。与此同时平台更广泛地开放了一系列连接器和生命科学研究插件让广大研究人员也能利用主线模型更高效地完成部分科研任务。这款模型在开发之初就融入了更高级别的企业级安全控制和强化的访问管理机制确保它能在受严格监管的研究环境中进行专业的科学应用。访问评估基于三项核心原则包含有益使用、强效治理与安全监督以及具备企业级安全的受控访问。具体到操作层面参与机构必须从事具有明确公共利益的合法科学研究维持适当的治理、合规和防滥用控制机制将模型访问权限严格限制在安全、管理完善的内部环境中且仅供经过严格审批的用户使用。参与机构须同意生命科学研究预览版的各项条款并遵守API使用政策在入驻或后续合作期间平台可能会随时要求机构提供额外的补充信息。符合要求的组织可以通过资格和安全审查流程申请访问权限。在研究预览期间只要不违反滥用防护规定使用该模型不会消耗现有的额度或Token。随着项目规模的扩大有关定价和可用性的更多细节将陆续公布。拥抱顶尖科研生态生命科学模型的初衷是帮助科研机构在需要技术能力和运营控制并重的环境中更快地产出更高质量的研究成果。OpenAI专属生命科学团队联同麦肯锡、波士顿咨询集团以及贝恩Bain公司等顾问合作伙伴正全力协助各大机构发掘高价值的应用场景将模型无缝整合到企业现有的研发管线中推动产出实实在在的成果。AmgenModernaAllen InstituteThermo Fisher Scientific等众多知名机构已经深度参与其中将GPT-Rosalind应用于驱动科学发现的核心工作流。目前平台正与Los Alamos National Laboratory洛斯阿拉莫斯国家实验室等国家级科研机构开展深入合作共同探索由AI引导的蛋白质和催化剂设计重点研究AI系统在保留或优化关键功能特性的前提下精准修改生物结构的能力。随着不断的迭代与进化这些智能系统必将成为科学发现旅程中越来越能干的破局者协助科学家以更快的速度完成从提出问题到寻找证据、从积累证据到形成洞察、最终从洞察转化为患者救命新疗法的全过程。参考资料https://openai.com/index/introducing-gpt-rosalind/

击败95%人类专家！OpenAI生命科学模型GPT‑Rosalind进入新药发现快车道

最新文章

EF Core 10向量搜索扩展仅支持.NET 8+？不！这3种降级兼容方案已被头部金融客户验证上线

从Kaggle竞赛到工业落地：MATLAB环境下XGBoOST调参的实战避坑指南

保姆级教程：用Python和LQR从零实现自动驾驶横向控制（附MATLAB代码对比）

别再自己搭文件服务器了！Spring Boot整合阿里云OSS，5分钟搞定图片上传功能

高德/百度地图API实战：如何用AOI数据给你的POI打上“商圈”标签？

架构师视角：vue-office在企业级文档预览系统中的技术实现与优化策略

推荐文章

相关文章

分享文章

更多文章

别再死记硬背了！用一张图彻底搞懂Kafka的Topic、Partition和消费组

DDR信号完整性实战：从DQS/DQ时序到读写眼图分析

速腾聚创雷达点云格式转换实战：手把手教你用rs_to_velodyne功能包对接主流SLAM算法

逆向实战：用r0capture抓取某社交App登录协议，从pcap到Wireshark分析全流程

NLP学习笔记12：预训练模型——从 BERT 到 GPT 与 T5

5步高效配置LXMusic开源音源：专业级音乐播放解决方案

告别混乱的@Cacheable：用l2cache的CacheService抽象层重构你的Spring Boot缓存代码

手把手教你搞定CentOS 7.9离线服务器：从本地yum源到Nvidia A100显卡驱动完整配置

Vector-CANoe实战指南 - 从零搭建CANFD仿真工程

Role: 健康生活顾问

不只是开台虚拟机：用Azure虚拟网络+VNet对等互联，低成本搭建你的第一个跨区域微服务测试环境

智能车竞赛调参血泪史：从串级PID到并行PID，我是如何让直立车‘稳如老狗’的