中山大学团队研发智能AI优化工具，解决长思考模型效率难题

2025年9月13日

（图片来自网络）

中山大学团队研发智能AI优化工具

中山大学深圳校区的罗昊天、沈利等研究者组成的国际合作团队，完成了一项突破性研究——研发出名为“长度和谐微调（O1-Pruner）”的AI优化方法，针对OpenAI的O1这类“长思考”模型推理冗余问题，优化推理速度与效率。该研究发表于2025年1月29日，已公开在arXiv平台，论文编号为arXiv:2501.12570v2，研究代码即将开源到GitHub。

当谈论AI推理时，OpenAI的O1模型如同“话痨学生”——解题时写长篇思考，却让用户等待超长。研究团队发现其“长度不和谐”问题：简单题却长篇解答，如同厨师做炒鸡蛋写详细烹饪手册。通过测试MATH数学题库等实验，发现最短答案准确率更高，这挑战了“思考越多越好”的传统认知。

核心创新：长度和谐微调（O1-Pruner），像一把智能剪刀，专门修剪模型推理过程中的冗余内容。其通过设计“长度-和谐奖励”机制，平衡答案准确性及推理简洁性，采用近端策略优化（PPO）训练方法，如同师父教徒弟学习高效解题技巧。实验结果显示，优化后Marco-o1-7B模型推理长度缩短了40.5%，准确率从73.4%提升至76.8%；QwQ-32B模型推理长度缩短34.7%，准确率提升至89.3%。

研究团队还提出“准确性-效率得分（AES）”综合评价指标，用于衡量模型在准确性与效率之间的平衡。对比实验表明，O1-Pruner在平衡两项指标上表现卓越。消融实验发现，奖励机制中的平衡参数λ对模型性能影响显著，当λ设置为2时，模型实现最佳准确性与效率平衡。此外，该优化方法通用性强，可扩展至数学、科学等多类推理任务，为AI实际应用降低计算成本提供新思路。研究团队计划进一步优化奖励机制，扩大应用场景。

Q：O1-Pruner是什么？它是如何工作的？
A：O1-Pruner是中山大学团队开发的AI模型优化方法，可解决“长思考”模型推理冗余问题。它如同智能编辑，通过特殊奖励机制引导模型生成既准确又简洁的答案——当模型给出短而正确的答案时获得最高奖励，若为求快而出错则会受到惩罚，从而让模型学会高效推理。

Q：优化后模型效果如何？
A：实验结果令人惊喜。经过O1-Pruner优化的Marco-o1-7B模型，推理长度缩短40.5%，准确率从73.4%提升至76.8%；推理时间也大幅缩短。更大的QwQ-32B模型效果同样显著，推理长度缩短34.7%，准确率提升至89.3%，效率提升对实际应用意义重大。

Q：如何解决“长度不和谐”问题？
A：“长度不和谐”指AI模型推理时产生冗余解答，如同做简单题写长篇大论。研究发现最短答案准确率更高，挑战了“思考越多越好”认知。O1-Pruner通过智能修剪冗余，让模型学会高效解题。

（声明：该内容经AI精编）查看原网页

精彩评论（10）

网友10 2025-09-13 14

在教育领域能帮助学生，有前景，希望早日应用。
网友9 2025-09-13 14

体现了AI从强到优的方向，长远很重要，值得关注。
网友8 2025-09-13 14

农村居民也能受益，AI优化后解决难题更方便了。
网友7 2025-09-13 14

科技发展让生活更高效，AI优化是很好的进步，支持！
网友6 2025-09-13 14

应用到企业分析能提升效率，值得期待它的推广。
网友5 2025-09-13 14

AI越来越会做题目了，这个优化能更快出结果，很好！
网友4 2025-09-13 14

技术设计很巧妙，解决了重要问题，很佩服研究团队。
网友3 2025-09-13 14

老年人用也方便，AI优化能省时间，生活更便捷。
网友2 2025-09-13 14

从科技角度讲，解决了AI长思考效率问题，期待实际应用效果。
网友1 2025-09-13 14

这个智能工具太棒了，以后AI效率能提高，学习用也方便！

查看“中山大学团队研发智能AI优化工具，解决长思考模型效率难题”相关搜索 >

中山大学团队研发智能AI优化工具，解决长思考模型效率难题

精彩评论（10）

最新新闻