阿里发布新一代AI基础模型架构，成本暴降近九成！

2025年9月12日

（图片来自网络）

阿里通义实验室今日凌晨发布下一代基础模型架构Qwen3-Next，并训练出基于该架构的Qwen3-Next-80B-A3B-Base模型。该模型参数达800亿，但仅激活30亿参数，仅需前代Qwen3-32B 9.3%的GPU计算资源，推理吞吐量提升至前者的10倍以上，且支持原生262144个token上下文长度。

同时，阿里开源了指令模型与思维模型：指令模型性能接近阿里235B旗舰模型，思维模型表现优于谷歌闭源模型Gemini-2.5-Flash-Thinking。整体训练与推理成本仅为前代模型的10%不到。

架构创新包含混合注意力机制、高稀疏度MoE结构、训练稳定优化及多Token预测（MTP）等，已在魔搭社区、Hugging Face等平台开源，开发者可通过阿里云百炼、NVIDIA API Catalog等渠道体验。

该模型突破“3B激活参数对标旗舰模型”的瓶颈，在性能与效率间实现新平衡，为AI模型降本提速提供有效路径，未来阿里也将持续优化该架构并推出Qwen3.5版本。

（声明：该内容经AI精编）查看原网页

精彩评论（10）

网友10 2025-09-12 12

期待阿里以后推出更多开源模型，助力行业发展。
网友9 2025-09-12 12

从技术角度看，混合注意力等创新很关键，降本提效双丰收。
网友8 2025-09-12 12

AI模型发展这么快，感觉以后很多领域都会受益。
网友7 2025-09-12 12

虽然不懂技术，但知道成本降了就开心，以后使用体验更好。
网友6 2025-09-12 12

为国家科技发展骄傲，这样降本后更多人能用上好模型。
网友5 2025-09-12 12

模型架构创新确实不错，激活参数控制得好，推理更快了。
网友4 2025-09-12 12

企业用这个模型可以节省成本，效率也提高，很实用。
网友3 2025-09-12 12

作为学生，我觉得这种技术进步很有意思，能学到很多。
网友2 2025-09-12 12

科技发展得这么快，模型变小变强还便宜，感觉未来很光明。
网友1 2025-09-12 12

阿里这个模型很厉害，成本降这么多，以后用更方便了。

查看“阿里发布新一代AI基础模型架构，成本暴降近九成！”相关搜索 >

阿里发布新一代AI基础模型架构，成本暴降近九成！

精彩评论（10）

最新新闻