DeepMind用AI重构科研流程,Kaggle竞赛击败84%选手

(图片来自网络)
DeepMind用AI重构科研流程,在Kaggle竞赛击败超八成选手
近日,谷歌DeepMind联合MIT、哈佛发布突破性成果,开发出能帮助科学家自动生成“专家级科研实证软件”的AI系统。该系统结合大语言模型(LLM)与树搜索(tree search)技术,重新定义科研流程,展现卓越表现。
现代科研对软件依赖日益加深,但从化学模型到社会系统预测,开发适用于特定领域的代码常需数年,且依赖研究者直觉与经验。研究团队将这些难题定义为“可评分任务”(scorable tasks),并开发AI系统自动生成解决此类任务的“实证软件”(empirical software),旨在提升科研效率。
该AI系统工作流程如下:
- 用户提供具体问题描述、评价指标与数据
- 大语言模型(LLM)根据线索生成候选Python代码
- 树搜索程序在沙盒环境中运行候选代码并获取质量评分
- 系统通过树搜索算法(如PUCT)平衡开发和探索,持续改进代码
- 还能整合外部研究思想(如论文、教材、AI工具),丰富代码生成思路
在2023年16场Kaggle竞赛中,该AI系统表现卓越,平均公共排行榜百分位数领先,击败超84%人类选手,体现其科研编程能力。研究团队表示,AI通过主动整合研究思想实现“超人表现”,为加速科学发现提供新路径。
在生物信息学等领域测试时,该系统提出87种全新方法,其中40种超越人类专家方案,在基因组学任务中表现提升显著。此外,在神经科学等前沿领域也展现优势,为科研流程重构带来更多突破。
(来源:arXiv)
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年9月13日:二手机贩子新套路瞄准儿童零花钱 存在消费陷阱
- 2025年9月13日:DeepMind科学掌门人首次揭秘:拿完诺奖只是开始,终极目标是打造「科学API」,让人人都能搞科研
- 2025年9月13日:甲骨文股价暴涨带动AI供应链热潮 中国供应链企业迎红利
- 2025年9月13日:大众平价电动车核心技术升级:自研电机与耐用电池加持
- 2025年9月13日:AI大模型现“见机行事”:技术优化与体验变化
- 2025年9月13日:张禹珍4-2挫德国劲敌,锁定与王楚钦半决赛
- 2025年9月13日:WTT澳门冠军赛男单1/4决赛:雨果鏖战6局击败弗朗西斯卡进半决赛
- 2025年9月13日:西甲对决:姆巴佩断球反击建功,4场4球领跑射手榜,3次皇社收获3球
- 2025年9月13日:姆巴佩传射助皇马2 - 1逆转皇社,当选本场比赛最佳球员
- 2025年9月13日:孙颖莎逆转夺冠 以4 - 1晋级女单4强
- 2025年9月13日:国宝画重点|“汉代四绝”里藏着的文化密码
- 2025年9月13日:服贸会展现‘数智’与‘金融’双向奔赴,金融服务创新图景
- 2025年9月13日:财政政策积极有为 推动经济质效提升
- 2025年9月13日:191423亿元创新高!文化产业活力彰显经济新引擎
- 2025年9月13日:经贸盛会连台,展现开放创新合作大势
- 2025年9月13日:令人身心俱疲的焦虑,该如何化解 | 科普时间
- 2025年9月13日:2025金熊猫国际文化论坛启动全球影像合作计划,以“文明共聚 开创未来”为主题
- 2025年9月13日:以夜空为屏,武汉为长江举办2025长江文化艺术季开幕式
- 2025年9月13日:免签来华是种什么体验?听听这些外宾怎么说
- 2025年9月13日:从‘有学上’到‘上好学’:‘十四五’时期教育财政支持成果显著
精彩评论(10)