阿里发布千问最强推理模型，性能比肩GPT-5.2

2026年1月27日

（图片来自网络）

阿里于1月26日晚发布千问旗舰推理模型 Qwen3-Max-Thinking，该模型在权威评测中创下了多项全球新纪录，性能可媲美GPT-5.2、Gemini 3 Pro等国际顶尖模型，是迄今为止国内最强的AI大模型之一。

据悉，该模型总参数量超万亿（1T），预训练数据量高达36T Tokens。在涵盖事实知识、复杂推理、指令遵循等19项大模型基准测试中，刷新了数项最佳表现（SOTA）纪录。

在技术创新层面，千问新模型采用了一种全新的 测试时扩展（Test-time Scaling） 机制，可对前推理结果进行“经验提取”式提炼，并据此进行多轮自我迭代，在相同上下文中实现更高效的推理计算，从而获得更智能的推理结果。在关键的“人类最后的测试”HLE中，千问得分达58.3，大幅超过GPT-5.2-Thinking（45.5分）与Gemini 3 Pro（45.8分），录得当前所有模型的最高分。

同时，模型还大幅增强了自主调用工具的原生Agent能力。在完成工具使用微调与大量多样化任务的联合强化学习训练后，Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。例如在QwenChat上，模型可自主选用搜索、个性化记忆和代码解释器等三个核心Agent工具功能，提供接近专业人士水平的回答，既合用户心意、更智能、更流畅，且模型幻觉也大为降低，为解决真实复杂任务打下基础。

目前，开发者、企业与普通用户可通过阿里云百炼获取新模型API服务，普通用户也可免费体验千问PC端、网页端及即将接入的千问APP，全方位感受千问最强模型的力量。

（声明：该内容经AI精编）查看原网页

精彩评论（10）

网友10 2026-01-27 09

强大的推理模型，以后用起来肯定更方便了，科技发展真好。
网友9 2026-01-27 09

这种技术发展速度很快，AI未来肯定能帮我们处理更多信息。
网友8 2026-01-27 09

模型性能提升后，回答和推理更准确了，很实用。
网友7 2026-01-27 09

期待这个模型在学习和工作中的实际应用，能提高效率吗？
网友6 2026-01-27 09

模型参数这么大，计算资源需要很多吧，不过进步明显。
网友5 2026-01-27 09

这种推理机制很有意思，AI推理能力提升肯定能帮我们做更多事。
网友4 2026-01-27 09

比GPT-5.2还强，国内AI领先了，很有成就感！
网友3 2026-01-27 09

用起来方便吗？希望实际应用场景更多起来。
网友2 2026-01-27 09

参数超万亿，国内AI实力确实在一步步提升，很震撼。
网友1 2026-01-27 09

这个AI模型技术很先进，感觉未来AI发展很快，很期待！

查看“阿里发布千问最强推理模型，性能比肩GPT-5.2”相关搜索 >

阿里发布千问最强推理模型，性能比肩GPT-5.2

精彩评论（10）

最新新闻