斯坦福与英伟达联合推出AI推理新范式，刷新多领域技术标杆

2026年1月25日

（图片来自网络）

斯坦福大学与英伟达联合发布一项颠覆性AI推理新范式——TTT-Discover（Test-Time Training 测试时训练），打破「模型训练完即定型」的传统铁律，让AI在推理阶段针对特定难题「现场长脑子」，凭数百美元算力刷新多领域技术标杆（SOTA）。

从重写数学猜想、碾压人类代码速度，到算法竞赛降维打击，这种「激进进化」正在重新定义机器智能边界。如果把现有AI比作学霸，现在的新范式让它们从「考试前读万卷书、考时靠回忆答题」，转变为「考场现场长脑子、为一次满分敢废了自己」。

核心逻辑颠覆：这项研究不追求「平均分」，只想要「一次满分」。在传统训练中追求全能选手，而TTT-Discover认为科学发现不需要通用，只要找到特定问题的答案，哪怕模型为解此题偏科、甚至「过拟合」，都算成功。它采用「现场进化」「赌徒心态」「用完即弃」策略。

战绩亮眼：在多领域展现突破：

局限与思考：尽管战绩辉煌，仍存在局限。其一，成本高昂，单题测试训练成本约500美元；其二，模型偏科，无法通用；其三，需「打分器」，仅适用于有连续奖励信号问题（如速度、边界问题）。

作者理念：通讯作者Yu Sun是「Test-Time Training」坚定布道者，其长期愿景是从「静态模型」转向「动态进化」。他认为学习不应在训练停止，推理阶段也应持续学习，这项新范式是他七年研究的激进成果。

哲学启示：这种AI智慧形态，是「为了解决难题瞬间集中资源、异化突变」的形态，如同「为照亮未知瞬间而燃尽自我的流星」，对「智慧」定义带来新思考。