开源模型首夺物理奥赛金牌 上海AI Lab 235B模型击败GPT-5与Grok-4
(图片来自网络)
开源模型首次在国际物理奥林匹克竞赛中夺金!上海AI Lab推出的P1 - 235B - A22B模型成为首个实现这一成果的开源模型,在物理推理领域实现新突破。
竞赛成绩亮点:该模型在2024 - 2025年覆盖的13场顶级物理竞赛基准(HiPhO)中,斩获12金1银,成功突破金牌线,成绩超越了GPT - 5(11金)和Grok - 4(10金)等知名闭源模型。
模型与系统创新:P1 - 235B - A22B依托多阶段强化学习训练,搭配专门设计的协同进化多智能体系统PhysicsMinions(含视觉、逻辑、审核三模块),在复杂物理问题的推理和解决上展现出卓越能力。
训练与数据支撑:研究团队构建了包含数千条奥赛级题目的训练数据集,通过“上下文窗口扩展”和“通过率过滤”等策略优化模型训练,提升了高复杂度问题解决能力。
物理推理意义:物理推理是理解现实世界的基础能力,国际物理奥林匹克赛事以其高标准成为检验物理智能的标尺。AI在物理奥赛中夺金,标志着模型已初步具备应对复杂物理问题的潜力,也推动通用物理智能发展。
通用能力延伸:P1系列模型在数学、代码、STEM等领域也展现出优势,通专融合能力持续提升,证明物理推理能力具备泛化性。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年10月25日:全球首个AI科技消费盛会开幕:AI走进百姓生活
- 2025年10月25日:中国代表团出席联合国全球卫星导航系统国际委员会第19届大会 展现北斗发展成果与全球方案
- 2025年10月25日:上海体育大学发布‘上体体育大模型2.0’,体育领域AI技术再升级
- 2025年10月25日:解码深圳AI终端生态:荣耀引领万亿级AI产业进化
- 2025年10月25日:荣耀押注AI生态 拼生态战手机厂商激战正酣
- 2025年10月25日:朱啸虎押注300元AI玩偶,面临退货与内卷危机
- 2025年10月25日:同济大学发布全球首部《工程智能白皮书》
- 2025年10月25日:体操世锦赛女子平衡木:18岁张清颖以绝对优势夺冠 创个人与团队佳绩
- 2025年10月25日:我国科学家研发手机版斜视测量技术 病人可居家筛查
- 2025年10月25日:2025顶尖科学家论坛开幕,WLA大奖得主分享喜悦与学术传承
- 2025年10月25日:2025世界顶尖科学家论坛开幕,近150位全球顶尖科学家汇聚上海探讨未来科学
- 2025年10月25日:图灵奖得主称全球超算500强榜单暂无中国超算,中国超算达顶尖水平
- 2025年10月25日:2025安凯微电子开发者论坛圆满落幕:多模态与智能体落地探索
- 2025年10月25日:丘成桐临港为弟子颁奖 鼓励中国学者拓展国际视野
- 2025年10月25日:AI视频Sora2:抖音风格再创造,科技新赛道博弈
- 2025年10月25日:太阳系星际访客近日点到来 哈佛天文学家推测其‘神秘行为’
- 2025年10月25日:全球科技新品集中亮相‘双11’,创意黑科技点亮生活新体验
- 2025年10月25日:台湾光复纪念日设立为法定纪念日
- 2025年10月25日:珍贵历史影像!80年前台湾光复时刻重磅回顾
- 2025年10月25日:小米17 Air谍照曝光:2亿像素主摄+eSIM+超薄机身明年发布?

精彩评论(10)