阿里发布千问最强推理模型,性能比肩GPT-5.2

2026年1月27日
news

(图片来自网络)

阿里于1月26日晚发布千问旗舰推理模型 Qwen3-Max-Thinking,该模型在权威评测中创下了多项全球新纪录,性能可媲美GPT-5.2、Gemini 3 Pro等国际顶尖模型,是迄今为止国内最强的AI大模型之一。


据悉,该模型总参数量超万亿(1T),预训练数据量高达36T Tokens。在涵盖事实知识、复杂推理、指令遵循等19项大模型基准测试中,刷新了数项最佳表现(SOTA)纪录。


在技术创新层面,千问新模型采用了一种全新的 测试时扩展(Test-time Scaling) 机制,可对前推理结果进行“经验提取”式提炼,并据此进行多轮自我迭代,在相同上下文中实现更高效的推理计算,从而获得更智能的推理结果。在关键的“人类最后的测试”HLE中,千问得分达58.3,大幅超过GPT-5.2-Thinking(45.5分)与Gemini 3 Pro(45.8分),录得当前所有模型的最高分。


同时,模型还大幅增强了自主调用工具的原生Agent能力。在完成工具使用微调与大量多样化任务的联合强化学习训练后,Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。例如在QwenChat上,模型可自主选用搜索、个性化记忆和代码解释器等三个核心Agent工具功能,提供接近专业人士水平的回答,既合用户心意、更智能、更流畅,且模型幻觉也大为降低,为解决真实复杂任务打下基础。


目前,开发者、企业与普通用户可通过阿里云百炼获取新模型API服务,普通用户也可免费体验千问PC端、网页端及即将接入的千问APP,全方位感受千问最强模型的力量。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2026-01-27 09
    强大的推理模型,以后用起来肯定更方便了,科技发展真好。
  • 网友9 2026-01-27 09
    这种技术发展速度很快,AI未来肯定能帮我们处理更多信息。
  • 网友8 2026-01-27 09
    模型性能提升后,回答和推理更准确了,很实用。
  • 网友7 2026-01-27 09
    期待这个模型在学习和工作中的实际应用,能提高效率吗?
  • 网友6 2026-01-27 09
    模型参数这么大,计算资源需要很多吧,不过进步明显。
  • 网友5 2026-01-27 09
    这种推理机制很有意思,AI推理能力提升肯定能帮我们做更多事。
  • 网友4 2026-01-27 09
    比GPT-5.2还强,国内AI领先了,很有成就感!
  • 网友3 2026-01-27 09
    用起来方便吗?希望实际应用场景更多起来。
  • 网友2 2026-01-27 09
    参数超万亿,国内AI实力确实在一步步提升,很震撼。
  • 网友1 2026-01-27 09
    这个AI模型技术很先进,感觉未来AI发展很快,很期待!
查看“阿里发布千问最强推理模型,性能比肩GPT-5.2”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙