中山大学团队研发智能AI优化工具,解决长思考模型效率难题

2025年9月13日
news

(图片来自网络)




中山大学团队研发智能AI优化工具


中山大学深圳校区的罗昊天、沈利等研究者组成的国际合作团队,完成了一项突破性研究——研发出名为“长度和谐微调(O1-Pruner)”的AI优化方法,针对OpenAI的O1这类“长思考”模型推理冗余问题,优化推理速度与效率。该研究发表于2025年1月29日,已公开在arXiv平台,论文编号为arXiv:2501.12570v2,研究代码即将开源到GitHub。


当谈论AI推理时,OpenAI的O1模型如同“话痨学生”——解题时写长篇思考,却让用户等待超长。研究团队发现其“长度不和谐”问题:简单题却长篇解答,如同厨师做炒鸡蛋写详细烹饪手册。通过测试MATH数学题库等实验,发现最短答案准确率更高,这挑战了“思考越多越好”的传统认知。


核心创新:长度和谐微调(O1-Pruner),像一把智能剪刀,专门修剪模型推理过程中的冗余内容。其通过设计“长度-和谐奖励”机制,平衡答案准确性及推理简洁性,采用近端策略优化(PPO)训练方法,如同师父教徒弟学习高效解题技巧。实验结果显示,优化后Marco-o1-7B模型推理长度缩短了40.5%,准确率从73.4%提升至76.8%;QwQ-32B模型推理长度缩短34.7%,准确率提升至89.3%。


研究团队还提出“准确性-效率得分(AES)”综合评价指标,用于衡量模型在准确性与效率之间的平衡。对比实验表明,O1-Pruner在平衡两项指标上表现卓越。消融实验发现,奖励机制中的平衡参数λ对模型性能影响显著,当λ设置为2时,模型实现最佳准确性与效率平衡。此外,该优化方法通用性强,可扩展至数学、科学等多类推理任务,为AI实际应用降低计算成本提供新思路。研究团队计划进一步优化奖励机制,扩大应用场景。


Q:O1-Pruner是什么?它是如何工作的?
A:O1-Pruner是中山大学团队开发的AI模型优化方法,可解决“长思考”模型推理冗余问题。它如同智能编辑,通过特殊奖励机制引导模型生成既准确又简洁的答案——当模型给出短而正确的答案时获得最高奖励,若为求快而出错则会受到惩罚,从而让模型学会高效推理。


Q:优化后模型效果如何?
A:实验结果令人惊喜。经过O1-Pruner优化的Marco-o1-7B模型,推理长度缩短40.5%,准确率从73.4%提升至76.8%;推理时间也大幅缩短。更大的QwQ-32B模型效果同样显著,推理长度缩短34.7%,准确率提升至89.3%,效率提升对实际应用意义重大。


Q:如何解决“长度不和谐”问题?
A:“长度不和谐”指AI模型推理时产生冗余解答,如同做简单题写长篇大论。研究发现最短答案准确率更高,挑战了“思考越多越好”认知。O1-Pruner通过智能修剪冗余,让模型学会高效解题。



(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-09-13 14
    在教育领域能帮助学生,有前景,希望早日应用。
  • 网友9 2025-09-13 14
    体现了AI从强到优的方向,长远很重要,值得关注。
  • 网友8 2025-09-13 14
    农村居民也能受益,AI优化后解决难题更方便了。
  • 网友7 2025-09-13 14
    科技发展让生活更高效,AI优化是很好的进步,支持!
  • 网友6 2025-09-13 14
    应用到企业分析能提升效率,值得期待它的推广。
  • 网友5 2025-09-13 14
    AI越来越会做题目了,这个优化能更快出结果,很好!
  • 网友4 2025-09-13 14
    技术设计很巧妙,解决了重要问题,很佩服研究团队。
  • 网友3 2025-09-13 14
    老年人用也方便,AI优化能省时间,生活更便捷。
  • 网友2 2025-09-13 14
    从科技角度讲,解决了AI长思考效率问题,期待实际应用效果。
  • 网友1 2025-09-13 14
    这个智能工具太棒了,以后AI效率能提高,学习用也方便!
查看“中山大学团队研发智能AI优化工具,解决长思考模型效率难题”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙