智源EMU3.5发布 多模态世界模型开启新范式
(图片来自网络)
智源EMU3.5发布:多模态世界模型开启新纪元
10月30日,智源研究院正式发布「悟界EMU3.5」多模态世界大模型。在当前大语言模型(LLM)文本能力逐渐触顶、多模态被视为人工智能新方向的背景下,多模态数据融合难题成为行业焦点。智源通过创新技术找到「第三种Scaling范式」,为多模态领域发展注入新动力。
01 从效率到范式:解决核心挑战
多模态人工智能的核心挑战之一是建立「大一统模型」。智源选择「原生多模态」路线——使用统一自回归架构处理文本、图像、视频等数据。但此路线曾面临「推理效率低」的问题:自回归模型逐个预测Token生成图像时,速度远慢于并行生成的模型。为此,EMU3.5提出「DiDA(离散扩散自适应)」创新技术,实现高效混合推理预测,让自回归模型效率提升近20倍,解决了原生多模态路线的核心短板。
02 开启「第三 Scaling 范式」
基于效率突破,智源验证多模态「Scaling(规模化)」新范式。从模型参数(从8B拓展至34B)、训练数据(视频训练时长从15年增至790年)的规模化投入,模型性能显著提升。智源研究院院长提出,EMU3.5开启了继「语言预训练」和「后训练及推理」之后的「第三个Scaling范式」,理由包括架构统一性、设施可复用性、强化学习引入等,为多模态规模化发展提供新路径。
03 向世界学习:从Token到状态预测
EMU3.5将学习范式从「Next-Token Prediction(预测Token)」升级为「Next-State Prediction(预测状态)」,学习世界物理规律与因果关系。通过理解「桌边的咖啡」等场景的因果逻辑,模型能预测状态变化、规划行动,为具身智能(机器人)提供理解、规划和训练数据支持,推动通用人工智能发展。
目前智源已披露技术细节并计划开源模型,多模态世界模型领域的新范式有望落地。
最新新闻
- 2025年11月1日:零跑汽车10月销量突破7万台 创交付新高
- 2025年11月1日:英伟达CEO黄仁勋减持套现10亿 英伟达市值突破5万亿
- 2025年11月1日:MSC咨询合伙人金霞:可持续发展与AI结合,重构商业增长范式
- 2025年11月1日:2026载人航天飞行任务标识征集活动正式启动
- 2025年11月1日:蔚来乐道汽车达成11万台新车交付,距10万台里程碑仅13天
- 2025年11月1日:天禧AI 3.5正式亮相 超级互联3.0打破全生态壁垒
- 2025年11月1日:小米米家空调新添‘智能诊断’功能 可联网远程检测设备异常
- 2025年11月1日:小米汽车10月交付量超4万台 科技赋能智能出行新篇章
- 2025年11月1日:燃料从“铀”到“钍”,中国核能科技实现全新突破!
- 2025年11月1日:理想MEGA召回耗资17.64亿 主动担责推动行业变革
- 2025年11月1日:林青霞与秦汉:21年爱而不得,78岁单身仍守旧照,她最终选择幸福婚姻
- 2025年11月1日:70岁潘虹现状曝光:事业与生活的辩证,董卿感慨引人思考
- 2025年11月1日:刘谦抗癌后近况曝光,面容变化引关注,透露年底重要活动
- 2025年11月1日:离婚4年,42岁佟丽娅高调官宣喜讯:事业爆发成“高攀不起”的存在,与陈思诚口碑形成鲜明对比
- 2025年11月1日:三次结婚两度丧子,60岁张卫健形象变化的背后人生故事
- 2025年11月1日:孙甘露带您探秘2025上海书展:书香满城 繁花绽放
- 2025年11月1日:聚焦民企‘痛点’‘难点’ “十五五”谋划民营经济发展
- 2025年11月1日:新农人逐梦乡村:创新点亮振兴路
- 2025年11月1日:美国联邦政府停摆满月:僵局难破 危机显现
- 2025年11月1日:中国第42次南极考察队从上海起航开展科考任务

精彩评论(10)