斯坦福与英伟达联合推出AI推理新范式,刷新多领域技术标杆

2026年1月25日
news

(图片来自网络)

斯坦福大学与英伟达联合发布一项颠覆性AI推理新范式——TTT-Discover(Test-Time Training 测试时训练),打破「模型训练完即定型」的传统铁律,让AI在推理阶段针对特定难题「现场长脑子」,凭数百美元算力刷新多领域技术标杆(SOTA)。


从重写数学猜想、碾压人类代码速度,到算法竞赛降维打击,这种「激进进化」正在重新定义机器智能边界。如果把现有AI比作学霸,现在的新范式让它们从「考试前读万卷书、考时靠回忆答题」,转变为「考场现场长脑子、为一次满分敢废了自己」。


核心逻辑颠覆:这项研究不追求「平均分」,只想要「一次满分」。在传统训练中追求全能选手,而TTT-Discover认为科学发现不需要通用,只要找到特定问题的答案,哪怕模型为解此题偏科、甚至「过拟合」,都算成功。它采用「现场进化」「赌徒心态」「用完即弃」策略。



  • 现场进化:推理阶段针对问题直接修改模型参数,针对性优化

  • 赌徒心态:修改损失函数,鼓励探索极端区域(高风险高回报)

  • 用完即弃:解题后模型废弃,专用于特定问题


战绩亮眼:在多领域展现突破:



  • 数学难题:在Erdős 最小重叠问题上,将上界从0.380924压至0.380876,构造出拥有600分段的非对称函数,远超人类最佳51分段

  • 代码优化:GPU内核优化(TriMul)中,比人类代码在A100上快50%,发现人类未想过的算子融合等操作

  • 算法竞赛:在AtCoder竞赛中击败最强AI并超越人类金牌选手历史最佳


局限与思考:尽管战绩辉煌,仍存在局限。其一,成本高昂,单题测试训练成本约500美元;其二,模型偏科,无法通用;其三,需「打分器」,仅适用于有连续奖励信号问题(如速度、边界问题)。


作者理念:通讯作者Yu Sun是「Test-Time Training」坚定布道者,其长期愿景是从「静态模型」转向「动态进化」。他认为学习不应在训练停止,推理阶段也应持续学习,这项新范式是他七年研究的激进成果。


哲学启示:这种AI智慧形态,是「为了解决难题瞬间集中资源、异化突变」的形态,如同「为照亮未知瞬间而燃尽自我的流星」,对「智慧」定义带来新思考。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2026-01-25 20
    从研究创新角度看,这是对深度学习范式的重要挑战,未来值得关注。
  • 网友9 2026-01-25 20
    感觉科技发展太快,这种新范式以后会变成日常工具吗?
  • 网友8 2026-01-25 20
    太棒了,以后用AI处理问题更高效了,生活工作都方便很多。
  • 网友7 2026-01-25 20
    新技术发展要慢慢来,得保证安全,不能有风险。
  • 网友6 2026-01-25 20
    这技术对科技企业来说很关键,能提升研发效率,值得关注。
  • 网友5 2026-01-25 20
    听不懂那些专业术语,但觉得AI能解决难题很厉害,以后肯定能用上。
  • 网友4 2026-01-25 20
    从学术角度,这种测试时训练的理念很有创新性,对机器学习领域是重要进展。
  • 网友3 2026-01-25 20
    哇,AI现在能这么厉害了,感觉未来很有意思,想学点相关知识。
  • 网友2 2026-01-25 20
    从科技发展看,这是重要突破,但也要关注应用安全,不能太激进。
  • 网友1 2026-01-25 20
    这技术以后肯定能解决好多问题,AI越来越厉害了,以后生活更方便了。
查看“斯坦福与英伟达联合推出AI推理新范式,刷新多领域技术标杆”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙