阿里发布千问Gemini3级模型，国产大模型性能再突破

2026年1月28日

（图片来自网络）

阿里发布千问Gemini3级模型，国产大模型性能再创佳绩

近日，阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking，这款国产大模型在多项核心能力上展现突破，引发行业广泛关注。

参数与数据表现：总参数超万亿、预训练数据量高达36T Tokens，在科学知识（GPQA Diamond）、数学推理（IMO-AnswerBench）、代码编程（LiveCodeBench）等多项权威评测中刷新全球纪录。
核心能力突破：在数学推理AIME 25和HMMT 25上取得国内首个双满分，在“人类最后的测试”HLE中得分58.3，大幅超过Gemini 3 Pro等国际大模型；在复杂场景（如电商网站、体感控制打气球游戏）中展现出色能力，电商场景下代码生成流畅，体感控制流程完整但精度待优化。
技术机制革新：采用全新测试时扩展（Test-time Scaling）机制，提升推理性能同时更经济；通过“三步训练法”（工具使用微调、多样化任务强化、条件反射形成）增强工具结合能力，在复杂问题解决中展现“肌肉记忆”优势。

对比传统大模型，千问3在工具使用效率、代码工程直觉等方面展现“从工具到协作者”的跃迁，为国产AI发展带来新动力。

（作者｜ Yoky ｜邮箱｜ yokyliu@pingwest.com）