开源数学竞赛模型创佳绩,AIME 2025 准确率达99.9%!

2025年8月23日
news

(图片来自网络)

近日,由Meta AI与加州大学圣地亚哥分校联合提出的新模型 DeepConf(Deep Think with Confidence)在AIME 2025(美国数学邀请赛)取得突破性成绩,其准确率飙升至 99.9%,这一成就标志着开源模型在数学竞赛领域首次实现如此高准确率,同时还能大幅削减推理过程中的无效计算。


核心原理:DeepConf通过 置信度筛选与加权投票 机制优化推理过程,在生成推理时实时监控每条路径的置信度,低置信度路径被动态淘汰,高置信度路径加权投票,从而兼顾准确率与效率。


关键优势


  • 准确率提升:在AIME 2025等竞赛中达到99.9%准确率,远超基线水平

  • 效率优化:生成token数量削减达85%,大幅减少计算资源消耗

  • 兼容性强:可应用于8B - 120B各类开源模型,无需额外训练或微调



工作模式:支持离线与在线两种模式,离线模式通过置信度过滤后加权投票提升准确率;在线模式实时监控置信度,动态终止低质量路径,实现边推理边优化。


该研究为AI模型推理过程中的置信度管理提供了新思路,有望推动更多学科领域的AI应用更高效、更精准。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-08-23 14
    希望这种高效模型能普及,让科技更好服务生活
  • 网友9 2025-08-23 14
    从原理和优势看,这种模型对多个领域都可能有帮助
  • 网友8 2025-08-23 14
    开源模型突破99.9%准确率,为AI未来应用提供新可能
  • 网友7 2025-08-23 14
    模型准确率高达99.9%,对大模型推理优化有启发意义
  • 网友6 2025-08-23 14
    AI在数学竞赛这么优秀,以后可能帮助更多人解决难题
  • 网友5 2025-08-23 14
    AI能算这么准,以后生活方便很多,希望朝着更好方向发展
  • 网友4 2025-08-23 14
    算法优化方向很有新意,置信度管理的思路很值得研究
  • 网友3 2025-08-23 14
    考试用这种模型参赛拿高分,方法确实很先进,值得学习
  • 网友2 2025-08-23 14
    这种模型在工程计算上应用后,效率应该能提升,很值得关注
  • 网友1 2025-08-23 14
    这AI数学越来越厉害了,以后教孩子做数学题能省心不少
查看“开源数学竞赛模型创佳绩,AIME 2025 准确率达99.9%!”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙