阿里开源图像模型Qwen-Image-Layered,实现PS级图层精准编辑,推动专业设计领域AI落地
(图片来自网络)
12月22日,阿里开源全新图像生成模型 Qwen-Image-Layered,首次在模型内实现PS级的图层理解与图像生成。该模型采用自研创新架构,可将图片“拆解”成多个图层,如同设计师使用Photoshop分层作图修图,实现几乎“零漂移”的AI图像精准编辑,彻底解决AI生图的一致性难题,推动大模型在专业设计领域的现实落地。
千问新模型打破了主流视觉大模型的“扁平式思维”,通过“分层”和“补全”建立对现实世界更准确的“物理式理解”,让AI从平面的“看图说话”迈向真实的“空间重构”。
在视觉大模型领域,图像一致性编辑曾是一大核心挑战。由于大模型对图片的理解是扁平的、像素点紧密耦合,不能像人一样感知物体远近、遮挡等物理关系,导致AI生图编辑存在“牵一发而动全身”的随机性,让AI绘图在专业设计领域(如广告、UI、影视后期)始终只能作为参考,无法真正取代专业工具。
Qwen-Image-Layered的出现改变了这一现状。模型采用全新的RGBA-VAE编码和创新的VLD-MMDiT架构,配合图层级3D位置编码,让AI能够自动“脑补”被遮挡部分的背景纹理,实现对图层和空间的深入理解和生成。千问团队从海量专业Photoshop(PSD)文件中提取真实图层逻辑,让AI拥有专业设计师的“分层思维”。
业内人士指出,该模型将为创意产业带来实质性变革。AI生图将不再是死板素材,而是一个可无限调整的素材库;图片编辑也不再需要复杂精细的人工操作,而是实现“内在可编辑性”,设计师、动画和影视制作人员可在保持背景或主体完全不变的前提下,对特定图层的构件进行位移、缩放或重绘,显著提升数字内容创作的生产效率。
目前,Qwen-Image-Layered已在魔搭社区和HuggingFace开源,开发者和企业可免费下载商用。阿里已开源近400个千问模型,全球下载量突破7亿次,衍生模型数超18万个,是全球第一的开源模型。通义大模型已服务超100万家客户,在中国企业级大模型调用市场中通义位居第一,是中国企业选择最多的大模型。
最新新闻
- 2025年12月22日:车评人陈震账号解封传言遭平台集体辟谣
- 2025年12月22日:小米17 Ultra系列定价上调,卢伟冰确认‘涨得还有点多’
- 2025年12月22日:檀健次与孟子义成颁奖礼焦点,95后全面把控内娱奖项背后行业观察
- 2025年12月22日:《哪吒2》3天破24.3亿夺冠,《阿凡达3》遇冷 国产片成年度票房冠军
- 2025年12月22日:雄鹿战绩低迷 附加赛席位渐行渐远 比赛成赛季转折点
- 2025年12月22日:富安健洋:未正式向阿森纳球迷告别 期待温布利对阵英格兰
- 2025年12月22日:新湘商创新破局:七米装备诠释产业担当
- 2025年12月22日:黑龙江民族博物馆展品展现黑土地先民冬日生存智慧
- 2025年12月22日:年度字词见证奋进中国高质量发展
- 2025年12月22日:美国人发愁:明摆着抢钱,但一个愿打一个愿挨——特朗普允许英伟达对华出口AI芯片并抽成25%
- 2025年12月22日:B站发布萝卜陈震账号封禁说明:涉纳税违规被依法封禁
- 2025年12月22日:美国签证新增社交媒体审查 大厂预警影响群体
- 2025年12月22日:张彬彬暖心帮毛晓彤提裙却被导演阻止,红毯小插曲成热议话题
- 2025年12月22日:赵文卓一家三口送女上学,18岁女儿赵子仪成美貌才华双在线典范
- 2025年12月22日:曾毅手表风波后首次露面,发布新团队全家福
- 2025年12月22日:《阿凡达3》票房口碑双降,第四部发展存疑
- 2025年12月22日:董勇:从穷困到甜蜜,演警生涯的逆袭与爱情故事
- 2025年12月22日:戈恩逃亡7年后回归:从汽车领袖变身管理大师的转型故事
- 2025年12月22日:马卡:皇马球迷对维尼修斯表现不满 嗜嘘声表达厌倦
- 2025年12月22日:U15国足东亚杯收官战3比0胜中国香港队 排名第三

精彩评论(10)