人大与腾讯团队用信息论解决大模型过度推理难题
(图片来自网络)
人大与腾讯团队结合信息论,揭示大模型过度推理的根源,并提出Adaptive Think机制,助力提升推理效率与准确性。
研究团队由中国人民大学、腾讯 Jarvis Lab等组成,聚焦大模型推理效率问题。当前大模型虽有强大推理能力,却存在“过度思考”现象,长推理链条可能降低准确率与效率。
研究从信息论角度出发,通过“熵与互信息”等底层信息指标,重新衡量模型思考的价值,最终提出Adaptive Think——让模型在“自信够了”时自动停止推理,用现有模型直接部署。
研究从技术、语义、实践三个维度分析大模型“过度思考”:
- 技术层面:长推理链如同噪声信道中的冗余比特,当超过模型推理容量时,额外推理会积累错误偏差。
- 语义层面:推理链延长后,单步推理带来的信息增益迅速递减,冗余步骤更多制造噪声,而非帮助模型接近正确答案。
- 实践层面:更长推理链并不必然带来更好结果,反而可能增加token消耗、延迟和算力开销,降低实际应用可行性。
为量化模型“思考效率”,团队构建包含全局(InfoBias)与局部(InfoGain)的评价框架,发现错误答案常伴随更长推理链与更高偏差。
提出的Adaptive Think机制,让模型“自我监控式推理”:通过熵衡量推理过程中的不确定性,当模型置信度达到预设阈值时,主动终止推理并输出答案。该机制使模型能根据任务难度灵活调整推理深度——简单问题只需少量推理,复杂问题则深入推理,兼顾速度与可靠性。
实验在8个大模型、6个推理任务基准上验证,Adaptive Think在保持准确率的同时,大幅减少token消耗与计算成本。例如,在数学任务上,token使用量减少一半以上,且准确率提升;在常识任务中,token消耗减少超80%。这证明大模型无需过度推理就能回答正确。
未来大模型应“聪明”而非“过长”,动态匹配任务难度、实时自我评估并调整推理深度。Adaptive Think为推理大模型走向成熟提供了关键思路。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年12月19日:HMD Terra M三防手机真机谍照曝光
- 2025年12月19日:拼多多股东大会:Temu重仓中国供应链,开启供应链升级新篇章
- 2025年12月19日:中国信通院解读《数据资产管理实践指南(8.0版)》:数据资产管理新实践指南
- 2025年12月19日:我国气象人工智能科学模型‘风源’发布推动气象预报科技创新
- 2025年12月19日:OpenAI冲击6万亿估值 再启千亿融资 亚马逊拟投700亿
- 2025年12月19日:13岁小将于子迪破格当选最佳青年游泳运动员
- 2025年12月19日:2.1万场招聘会、53.7万家企业护航,2025年秋招提供超千万岗位
- 2025年12月19日:经济大省挑大梁丨中国电商直通欧洲2亿人的‘空中快线’
- 2025年12月19日:大国新飞跃|文化瑰宝‘家底’更厚、保护更实、活力更足
- 2025年12月19日:脱贫村的这五年 | 从‘门票经济’到‘体验经济’——嘎拉有个桃花源
- 2025年12月19日:海南自贸港全岛封关,“零关税”等政策带来多项便利
- 2025年12月19日:我国加速布局未来产业抢占发展先机
- 2025年12月19日:各地多举措激发冰雪消费活力
- 2025年12月19日:对投资下滑:既要高度重视也要沉着冷静
- 2025年12月19日:海南封关运作:开放与管理的‘新奏章’
- 2025年12月19日:黄仁勋传记作者警示:谷歌成NVIDIA最大科技对手!
- 2025年12月19日:联想回应与字节AI手机合作:“天禧AI”可选豆包Agent问答
- 2025年12月19日:张江科学会堂开启科技与艺术跨界融合创新之旅
- 2025年12月19日:亚马逊AI团队调整:核心人员与部门架构变动
- 2025年12月19日:菜鸟拟入股九识智能,无人车业务深度整合拓展无人货运市场

精彩评论(10)