阿里发布新一代AI基础模型架构,成本暴降近九成!

(图片来自网络)
阿里通义实验室今日凌晨发布下一代基础模型架构Qwen3-Next,并训练出基于该架构的Qwen3-Next-80B-A3B-Base模型。该模型参数达800亿,但仅激活30亿参数,仅需前代Qwen3-32B 9.3%的GPU计算资源,推理吞吐量提升至前者的10倍以上,且支持原生262144个token上下文长度。
同时,阿里开源了指令模型与思维模型:指令模型性能接近阿里235B旗舰模型,思维模型表现优于谷歌闭源模型Gemini-2.5-Flash-Thinking。整体训练与推理成本仅为前代模型的10%不到。
架构创新包含混合注意力机制、高稀疏度MoE结构、训练稳定优化及多Token预测(MTP)等,已在魔搭社区、Hugging Face等平台开源,开发者可通过阿里云百炼、NVIDIA API Catalog等渠道体验。
该模型突破“3B激活参数对标旗舰模型”的瓶颈,在性能与效率间实现新平衡,为AI模型降本提速提供有效路径,未来阿里也将持续优化该架构并推出Qwen3.5版本。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年9月12日:从街头野球场到英超:乌切3年足球逆袭路
- 2025年9月12日:张本美和遭逆转无缘澳门赛女单8强
- 2025年9月12日:iPhone 17京东预约量突破343万,新机近期上市
- 2025年9月12日:东京田径世锦赛赛程公布,73名中国选手参与33项争夺
- 2025年9月12日:K-pop爱豆朴成训担任冬奥会宣传大使,曾是花样滑冰选手
- 2025年9月12日:利物浦母公司芬威计划出售旗下NHL冰球队 商业回报引关注
- 2025年9月12日:姚顺雨离职OpenAI,开启个人AI新篇章
- 2025年9月12日:中国联通推进“人工智能+”行动 展示千行百业赋能成果
- 2025年9月12日:微信AI搜索入口优化:灰度测试阶段调整
- 2025年9月12日:腾讯官方发布辟谣:前OpenAI成员入职报道不实
- 2025年9月12日:图拉姆兄弟成球队关键球员,传承父亲决心
- 2025年9月12日:上海男篮球员张镇麟在日本与球队会合 有望出战剩余两场热身赛
- 2025年9月12日:朱芳雨谈广东男篮夏季目标:冲刺总冠军决心明确
- 2025年9月12日:Meta超级智能实验室新论文陷争议 被指忽略大量前人研究
- 2025年9月12日:沃尔核材披露下一代448G高速通信线研发进展
- 2025年9月12日:一人公司悄然兴起,创业社区推动个体创业新形态
- 2025年9月12日:腾讯回应前OpenAI研究员“上亿薪资加盟”传闻:属谣言
- 2025年9月12日:金子涵退圈后抑郁状况引关注,剃光头行为成舆论焦点,章子怡、郝蕾等成讨论对象
- 2025年9月12日:刘邵子洋:18岁拜仁签约时,和诺伊尔之间曾隔多人?他曾外租后效力奥乙球队降级
- 2025年9月12日:渝超对阵图出炉!9月13日首场比赛渝中队对阵九龙坡队
精彩评论(10)