芝加哥大学团队发明「温度调节术」：让AI学会循序渐进思考问题

2025年11月8日

（图片来自网络）

近年来，人工智能在复杂任务上取得突破，但AI在学习过程中探索与利用的平衡难题仍未解决。芝加哥大学计算机科学系、统计系及丰田技术研究所的研究团队联合Meta AI，提出「探索性退火解码」这一创新方法，借鉴物理学中模拟退火的思想，系统解决AI语言模型在生成过程中的探索与利用平衡问题。

发现问题：AI思考也有「黄金时段」。研究团队通过分析大型语言模型生成过程，发现AI生成文本时存在阶段性特征：早期需充分探索不同思路，后期需高效利用已知方法。这一发现为优化策略提供了实证支撑。

创新方法：模拟退火遇上语言生成。该团队将模拟退火思想引入语言模型生成，提出「探索性退火解码」。该方法让AI在生成时动态调节「温度」参数：开始时高温度鼓励探索，逐步降低温度保障利用，像人类写作时先拓宽思路再聚焦内容。

实验验证显示，该方法在数学推理等任务上显著提升性能。例如，在Qwen-2.5-Math-7B模型上实现约2%的性能提升，且对不同规模模型和强化学习算法通用性强，展现广泛应用潜力。

应用价值：突破训练与推理限制。该技术不仅在训练阶段提升AI推理能力，在推理时也能优化现成模型表现。无需额外训练即可提升回答质量，降低应用门槛，为更多场景提供解决方案。

研究还揭示了该方法的深层机制和理论贡献，为理解和改进AI学习过程提供新思路，体现技术与理论的协同价值。