开源数学竞赛模型创佳绩,AIME 2025 准确率达99.9%!
(图片来自网络)
近日,由Meta AI与加州大学圣地亚哥分校联合提出的新模型 DeepConf(Deep Think with Confidence)在AIME 2025(美国数学邀请赛)取得突破性成绩,其准确率飙升至 99.9%,这一成就标志着开源模型在数学竞赛领域首次实现如此高准确率,同时还能大幅削减推理过程中的无效计算。
核心原理:DeepConf通过 置信度筛选与加权投票 机制优化推理过程,在生成推理时实时监控每条路径的置信度,低置信度路径被动态淘汰,高置信度路径加权投票,从而兼顾准确率与效率。
关键优势:
- 准确率提升:在AIME 2025等竞赛中达到99.9%准确率,远超基线水平
- 效率优化:生成token数量削减达85%,大幅减少计算资源消耗
- 兼容性强:可应用于8B - 120B各类开源模型,无需额外训练或微调
工作模式:支持离线与在线两种模式,离线模式通过置信度过滤后加权投票提升准确率;在线模式实时监控置信度,动态终止低质量路径,实现边推理边优化。
该研究为AI模型推理过程中的置信度管理提供了新思路,有望推动更多学科领域的AI应用更高效、更精准。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年11月5日:欧冠赛场本菲卡创造机会 希克评勒沃库森艰难胜利
- 2025年11月5日:迪马尔科谈国米欧冠胜利:接受结果盼劳塔罗重展笑容
- 2025年11月5日:巴萨旧将忆欧冠生涯:两座奖杯成玩笑,亚马尔难追梅西高度
- 2025年11月5日:亚马尔19岁前欧冠直接参与13球,与姆巴佩并列纪录
- 2025年11月5日:高通第四财季财报公布:营收增长超预期,前瞻指引备受关注
- 2025年11月5日:1.5℃升温红线几近失守,全球气候目标面临新挑战 多国反对
- 2025年11月5日:欧冠综述:曼城4-1多特!巴萨爆冷3-3,国米开局4连胜+穆帅4连败
- 2025年11月5日:曼城4-1多特蒙德!欧冠四轮不败进前四 哈兰德破纪录 福登双响
- 2025年11月5日:国际米兰欧冠首丢球,本赛季欧冠仅剩阿森纳维持不失球记录
- 2025年11月5日:苹果拟以10亿美元引入谷歌AI模型 助力Siri语音助手升级
- 2025年11月5日:欧冠11分钟连丢2球!巴萨连续被打穿,9场狂丢14球创12年新纪录
- 2025年11月5日:利雅得胜利4-0击败果阿,菲利克斯倒钩破门,马内献助攻,加里卜双响
- 2025年11月5日:巴萨欧冠遭遇9连丢球,同时刷新51场连续进球纪录
- 2025年11月5日:朝鲜女足2-0巴西晋级决赛!亚洲之光创历史,五度进女足世界杯决赛
- 2025年11月5日:伟大1-0!亚洲球队逆袭:欧冠历史首胜 仅建队11年 现场万人狂欢
- 2025年11月5日:曼城vs多特欧冠对决:首发阵容揭晓 哈兰德福登出战多特吉拉西阿德耶米参赛
- 2025年11月5日:利雅得胜利1 - 0领先果阿 加里卜任意球建功 亚冠联赛交锋
- 2025年11月5日:齐沃谈图拉姆状态与劳塔罗进球 国米欧冠赛前采访
- 2025年11月5日:比亚迪挑战日本微型车市场:中国汽车出海新布局?
- 2025年11月5日:中国互联网平台ESG责任实践:社会维度下的企业担当

精彩评论(10)