阿里发布新一代AI基础模型架构,成本暴降近九成!

2025年9月12日
news

(图片来自网络)



阿里发布新一代AI基础模型架构,成本暴降近九成!


阿里通义实验室今日凌晨发布下一代基础模型架构Qwen3-Next,并训练出基于该架构的Qwen3-Next-80B-A3B-Base模型。该模型参数达800亿,但仅激活30亿参数,仅需前代Qwen3-32B 9.3%的GPU计算资源,推理吞吐量提升至前者的10倍以上,且支持原生262144个token上下文长度。


同时,阿里开源了指令模型与思维模型:指令模型性能接近阿里235B旗舰模型,思维模型表现优于谷歌闭源模型Gemini-2.5-Flash-Thinking。整体训练与推理成本仅为前代模型的10%不到。


架构创新包含混合注意力机制、高稀疏度MoE结构、训练稳定优化及多Token预测(MTP)等,已在魔搭社区、Hugging Face等平台开源,开发者可通过阿里云百炼、NVIDIA API Catalog等渠道体验。


该模型突破“3B激活参数对标旗舰模型”的瓶颈,在性能与效率间实现新平衡,为AI模型降本提速提供有效路径,未来阿里也将持续优化该架构并推出Qwen3.5版本。



(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-09-12 12
    期待阿里以后推出更多开源模型,助力行业发展。
  • 网友9 2025-09-12 12
    从技术角度看,混合注意力等创新很关键,降本提效双丰收。
  • 网友8 2025-09-12 12
    AI模型发展这么快,感觉以后很多领域都会受益。
  • 网友7 2025-09-12 12
    虽然不懂技术,但知道成本降了就开心,以后使用体验更好。
  • 网友6 2025-09-12 12
    为国家科技发展骄傲,这样降本后更多人能用上好模型。
  • 网友5 2025-09-12 12
    模型架构创新确实不错,激活参数控制得好,推理更快了。
  • 网友4 2025-09-12 12
    企业用这个模型可以节省成本,效率也提高,很实用。
  • 网友3 2025-09-12 12
    作为学生,我觉得这种技术进步很有意思,能学到很多。
  • 网友2 2025-09-12 12
    科技发展得这么快,模型变小变强还便宜,感觉未来很光明。
  • 网友1 2025-09-12 12
    阿里这个模型很厉害,成本降这么多,以后用更方便了。
查看“阿里发布新一代AI基础模型架构,成本暴降近九成!”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙