斯坦福与英伟达联合推出AI推理新范式,刷新多领域技术标杆
(图片来自网络)
斯坦福大学与英伟达联合发布一项颠覆性AI推理新范式——TTT-Discover(Test-Time Training 测试时训练),打破「模型训练完即定型」的传统铁律,让AI在推理阶段针对特定难题「现场长脑子」,凭数百美元算力刷新多领域技术标杆(SOTA)。
从重写数学猜想、碾压人类代码速度,到算法竞赛降维打击,这种「激进进化」正在重新定义机器智能边界。如果把现有AI比作学霸,现在的新范式让它们从「考试前读万卷书、考时靠回忆答题」,转变为「考场现场长脑子、为一次满分敢废了自己」。
核心逻辑颠覆:这项研究不追求「平均分」,只想要「一次满分」。在传统训练中追求全能选手,而TTT-Discover认为科学发现不需要通用,只要找到特定问题的答案,哪怕模型为解此题偏科、甚至「过拟合」,都算成功。它采用「现场进化」「赌徒心态」「用完即弃」策略。
- 现场进化:推理阶段针对问题直接修改模型参数,针对性优化
- 赌徒心态:修改损失函数,鼓励探索极端区域(高风险高回报)
- 用完即弃:解题后模型废弃,专用于特定问题
战绩亮眼:在多领域展现突破:
- 数学难题:在Erdős 最小重叠问题上,将上界从0.380924压至0.380876,构造出拥有600分段的非对称函数,远超人类最佳51分段
- 代码优化:GPU内核优化(TriMul)中,比人类代码在A100上快50%,发现人类未想过的算子融合等操作
- 算法竞赛:在AtCoder竞赛中击败最强AI并超越人类金牌选手历史最佳
局限与思考:尽管战绩辉煌,仍存在局限。其一,成本高昂,单题测试训练成本约500美元;其二,模型偏科,无法通用;其三,需「打分器」,仅适用于有连续奖励信号问题(如速度、边界问题)。
作者理念:通讯作者Yu Sun是「Test-Time Training」坚定布道者,其长期愿景是从「静态模型」转向「动态进化」。他认为学习不应在训练停止,推理阶段也应持续学习,这项新范式是他七年研究的激进成果。
哲学启示:这种AI智慧形态,是「为了解决难题瞬间集中资源、异化突变」的形态,如同「为照亮未知瞬间而燃尽自我的流星」,对「智慧」定义带来新思考。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月25日:广厦遭山东终结7连胜 爆冷输球布朗末节狂轰21分
- 2026年1月25日:门西克退赛保送德约晋级 澳网八强阿卡遇本土挑战
- 2026年1月25日:辽宁遭遇比赛危机:末节20-4狂败 创队史第二低得分纪录 跌出联赛前12
- 2026年1月25日:我国累计建成超5500条幸福河湖,河湖变身群众休闲生态空间
- 2026年1月25日:美议员批评执法人员枪杀ICU护士:政府试图掩盖执法滥用行为
- 2026年1月25日:“中国是改变我命运的起点”——刚果(布)新水泥厂员工故事
- 2026年1月25日:从‘卖产品’到‘卖服务’ 一粒纽扣撬动产业融合转型
- 2026年1月25日:扎哈罗娃感慨:一个形容词道不尽中国多元鲜活
- 2026年1月25日:绘说现代化 | 夜经济“顶流”是如何成为的
- 2026年1月25日:全球连线 | 多国友人沉浸式体验中华年俗年味
- 2026年1月25日:冰雪经济焕活小镇经济:3个月10万游客助力增收百万
- 2026年1月25日:冰雪经济新玩法点燃消费热情:旅拍、美食等多元形式成热点!
- 2026年1月25日:百度APP春节发放5亿红包 文心助手联动打造AI互动玩法
- 2026年1月25日:教授关闭ChatGPT数据授权后两年学术成果‘清零’ 引发科学界争议
- 2026年1月25日:国行iPhone Air上市3个月后开启大规模降价,苹果降价背后有何深意?
- 2026年1月25日:科技巨头春节派现金红包:腾讯10亿元、百度5亿元
- 2026年1月25日:赵嘉义错失绝杀!郭艾伦19分率广州险胜青岛续取3连胜 徐昕数据亮眼
- 2026年1月25日:各地积极打造新场景 助力冬季文旅升温
- 2026年1月25日:冻雨不是雪!盘点低温雨雪冰冻天气常见认知误区
- 2026年1月25日:春节临近各地年宵花热销,多彩花卉点亮新春

精彩评论(10)