扩散模型革新语言生成!蚂蚁赵俊博:可直接修改Token的突破
(图片来自网络)
在量子位MEET2026智能未来大会上,浙江大学百人计划研究员、博士生导师,蚂蚁集团资深技术专家赵俊博带来了关于扩散语言模型的精彩分享,引发行业广泛关注。
赵俊博表示,当主流大语言模型多采用自回归架构时,扩散架构展现出独特优势——在推理过程中可直接修改和控制token,无需像自回归模型那样逐段生成,这有望实现更快的生成速度与更低的计算成本。团队因此将重点押注于扩散架构,并探索其独特的Scaling Law。
近期,团队发布并开源了千亿体量扩散语言模型LLaDA 2.0,成为该领域关键里程碑。报告显示,在训练与推理层面仍处早期但发展迅猛,已吸引谷歌、字节等巨头及初创公司布局。
核心观点总结如下:
- 生成模型可拟合数据分布,扩散与自回归是不同拟合路径
- 扩散架构(如“完形填空”方式)在相同计算量下参数更小,且推理时可修改token
- 千亿规模扩散语言模型已实现,但Scaling Law面临新挑战
赵俊博的演讲强调,扩散语言模型技术前景广阔,有望推动大语言模型发展新范式。MEET2026大会现场参与度高,观众反应热烈,行业对未来发展方向充满期待。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年12月12日:京东招募端侧AI芯片人才 存算一体技术成焦点
- 2025年12月12日:快造3D打印企业获美团等投资 拿下数亿元B轮融资(众筹刷新后)
- 2025年12月12日:快手商业私信日消耗破2000万,成商家经营提效利器
- 2025年12月12日:ChatGPT遭起诉涉谋杀:AI对话或加剧用户妄想引发命案
- 2025年12月12日:爆哭!陈伟霆官宣生子深层原因曝光,童年创伤催生出最温柔的父爱
- 2025年12月12日:爱奇艺尖叫夜明星社交现‘修罗场’,魏大勋杨幂同框微尴尬 多对CP甜度爆棚
- 2025年12月12日:汪小菲与马筱梅直播互动,半路夫妻情感细节引热议
- 2025年12月12日:2025爱奇艺尖叫之夜明星座位安排成焦点 李一桐白鹿与杨幂同框 宋祖儿有望接力
- 2025年12月12日:《唐诡奇谭》第四季定档!原班人马回归,12月17日爱奇艺独播
- 2025年12月12日:以食为媒 东北菜为冰雪旅游注入文化活力
- 2025年12月12日:巩固壮大实体经济根基|为推进强国建设提供坚实物质支撑
- 2025年12月12日:机器人企业精专广发展,跟随会长看中国制造
- 2025年12月12日:对话U30专题即将上线!聚焦前沿科创力量,感受科创勃勃生机!
- 2025年12月12日:特朗普签署行政令 推动美国人工智能监管统一 硅谷遇关键政策变化
- 2025年12月12日:内存价格上涨或影响中端机配置,12GB内存或在2026年后难再常见?
- 2025年12月12日:发挥群众主体作用 激发脱贫内生动力(时评)
- 2025年12月12日:如何定调2026?中央经济工作会议部署明年经济工作重点任务
- 2025年12月12日:何以中国 | 您有一份‘遗产’待继承
- 2025年12月12日:主播说联播:明年经济工作‘八个坚持’划重点,稳中求进绘蓝图
- 2025年12月12日:微生物合成技术赋能产业新发展——天津武清合成生物产业发展掠影

精彩评论(10)