兼得快与好!训练新范式TiM,原生支持FSDP+Flash Attention

(图片来自网络)
生成式AI的发展中,兼顾“生成速度”与“生成质量”一直是核心挑战。从Stable Diffusion到DiT、FLUX系列,社区对提升生成效率、优化输出质量的探索始终围绕扩散模型与少步模型展开,却难以突破固有缺陷。这便是训练目标引发的“生成质量”与“生成速度”矛盾根源——要么只学习无穷小局部动力学,要么只学习有限区间的端点映射,两者都存在内在限制。一项新研究提出了名为Transition Model(TiM)的新训练范式,试图从根本上解决这个问题。
什么是Transition Model(TiM)?它放弃了传统扩散模型学习“瞬时速度场”或少步模型学习“端点映射”的做法,转而直接建模任意两个时间点之间的完整状态转移。这意味着TiM在理论上支持任意步长的采样,并能将生成过程分解为多段粒度可灵活调整的细化轨迹。
- TiM的核心设计一:实现“灵活的单步尺寸”
- TiM的核心设计二:实现“多段细化轨迹的生成路径”
TiM的数学本质区别于传统模型。与扩散模型(建模瞬时速度场,局限性是瞬时速度需要时间区间趋近于0)、Meanflow(核心是建模平均速度场,局限性是丢了局部优化细节、质量容易饱和)不同,TiM做的是任意时间区间的任意状态间的状态转移,可认为是任意速度场,包含瞬时和平均速度;从解的形式看,扩散模型是局部PF-ODE的数值解,Meanflow是局部平均速度场解集,TiM求的是全局生成路径的解的流型。
TiM的训练与扩展性也极具优势。通过差分推导方程(DDE)替代依赖雅可比—向量乘积(JVP)的方法,原生兼容FSDP(分布式并行)和Flash Attention(加速注意力机制),训练更高效可扩展;同时通过时间重参化+核函数的损失加权策略,降低梯度方差、提升训练稳定性。
实验验证上,TiM-865M参数模型在多分辨率与多横纵比设置下,少步生成即可超越FLUX.1-Schnell/Dev(12B参数)的速度-质量权衡,兼顾快与好,为生成式AI发展提供新范式。
最新新闻
- 2025年9月14日:iPhone 17系列开售就破发?拼多多百亿补贴成最大降幅渠道!
- 2025年9月14日:京东方董事长陈炎顺谈AI焕新:3年500亿研发 推动产业升级与协作
- 2025年9月14日:北京1400余所中小学开设人工智能通识课 覆盖全学段教学安排
- 2025年9月14日:拼多多百亿补贴误伤正常用户 算法风控引争议
- 2025年9月14日:鸿蒙智行MPV新车谍照曝光 预计归属智界品牌
- 2025年9月14日:MiniMax上线新一代音乐生成模型 可生成整首歌曲 记者实测
- 2025年9月14日:服贸会上的文旅‘新’体验
- 2025年9月14日:鸿蒙智行MPV新车谍照曝光 智界品牌或推新款车型
- 2025年9月14日:国家电投AI创新应用大赛收官 构建人才梯队助力数字化转型
- 2025年9月14日:何小鹏:预计未来汽车公司年研发投入达500亿元
- 2025年9月14日:微软光学计算机登《Nature》:光算力颠覆GPU格局
- 2025年9月14日:OpenAI CEO萨姆·奥尔特曼:ChatGPT推出后难以入眠,担忧AI技术影响
- 2025年9月14日:斯堪尼亚中国如皋生产基地投产,Super牵引车亮相 年底经销商将超40家
- 2025年9月14日:国产大飞机出海:亚航兴趣待观察,C909获柬埔寨订单展未来
- 2025年9月14日:2025泰达汽车论坛在天津召开,聚焦产业新动能
- 2025年9月14日:绘说现代化:青海清洁能源发展“风”“光”无限,展现中国式现代化成果
- 2025年9月14日:《住房租赁条例》9月15日实施 这些变化关乎你我,划重点→
- 2025年9月14日:科学家解码萨吾尔山冰川消融秘密:解密冰川消融的“热量账本”
- 2025年9月14日:嘀嗒AI头像上线 顺风同行添‘新面孔’
- 2025年9月14日:马斯克意外力挺伦敦右翼11万抗议,英国议员谴责其言论
精彩评论(10)