AI突破!港大团队开源工具首胜人类博士,论文复现成现实!
(图片来自网络)
香港大学黄超团队开源的AI工具DeepCode在「论文复当代码」领域取得重大突破,在PaperBench测试中首次超越来自剑桥、伯克利等8所顶尖高校的机器学习博士,并领先Claude Code、Cursor等商用代码智能体。
在人工智能研究领域,学术论文的算法、模型架构等核心信息常因关键细节缺失,导致复现困难。DeepCode能够分析论文内容、理解算法逻辑并自动生成可运行代码,有效解决这一难题。
- DeepCode在复现成功率和代码质量上表现出众,目前GitHub上已收获近8000星标
- 该工具由香港大学年轻学者团队开发,为科研领域的AI创新应用提供新思路
- 通过四大基准测试,全面领先人类专家和商用智能体,展现强大实力
DeepCode具备多项核心能力,包括「论文转代码」(解析学术论文生成生产级代码并附带测试套件)、「想法转网页」(根据自然语言生成响应式前端页面)、「需求转服务」(将后端功能需求转化为高性能API接口等),采用系统化的三阶段框架(架构蓝图构建、代码实现、动态验证),实现从文档到可执行代码的自动转换。
AI编程工具虽然在简单任务中表现良好,但在复杂科研代码复现等需要深层理解的场景仍存在局限。DeepCode的突破表明,通过专业架构设计,AI可以在特定领域取得较好效果,为AI理解复杂任务提供新思路,也推动AI向更具实用性的工程工具方向发展。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年11月1日:新能源车企销量爆发!零跑月销首破7万,多新势力与比亚迪创新高
- 2025年11月1日:11月新机前瞻:华为重磅登场,中端机全面竞争
- 2025年11月1日:B站举办‘别笑,这很科学’趣味科学晚 8大科学奖项表彰创意研究
- 2025年11月1日:丰田推出儿童自动驾驶概念车 Kids Mobi:玩具化设计结合智能互动,为儿童打造安全出行工具
- 2025年11月1日:吉利汽车10月销量破30万,银河品牌提前达成年销百万目标
- 2025年11月1日:AMD 承认 Zen 5 处理器存在 RDSEED 指令缺陷,将通过微码更新修复
- 2025年11月1日:非遗麻质画创作致敬航天员张陆,家乡特色艺术为英雄留下艺术印记
- 2025年11月1日:夏普联合富士康推出首款纯电MPV 计划2027年上市
- 2025年11月1日:今年双11,聪明人都在偷偷换AI PC
- 2025年11月1日:新造车10月销量榜单揭晓:蔚来破4万、ES8产能冲刺1.5万
- 2025年11月1日:大连英博球员毕津浩禁区内建功 夺生涯首球
- 2025年11月1日:全运会跳水:全红婵将缺席女子单人10米跳台比赛
- 2025年11月1日:利物浦能否避免?卫冕冠军此前仅莱斯特城遭遇过英超5连败
- 2025年11月1日:神舟二十一号发射后首批科技人员返塔架开展恢复工作
- 2025年11月1日:特斯拉曝光Cybercab实车 部分组件接近量产状态
- 2025年11月1日:发射场菜单藏‘航天密码’:成功包、定胜糕承载飞天祝福
- 2025年11月1日:神舟二十一号首用3.5小时快速交会对接 创航天对接新方式
- 2025年11月1日:第42次南极考察启航 首艘国产极地科考船雪龙2号准备就绪
- 2025年11月1日:比亚迪10月销量再创新高 达441706辆
- 2025年11月1日:海光芯正冲刺港股:科技企业赴港上市拟披露信息

精彩评论(10)