阿里发布千问Gemini3级模型,国产大模型性能再突破

2026年1月28日
news

(图片来自网络)

阿里发布千问Gemini3级模型,国产大模型性能再创佳绩

近日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,这款国产大模型在多项核心能力上展现突破,引发行业广泛关注。

  • 参数与数据表现:总参数超万亿、预训练数据量高达36T Tokens,在科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项权威评测中刷新全球纪录。
  • 核心能力突破:在数学推理AIME 25和HMMT 25上取得国内首个双满分,在“人类最后的测试”HLE中得分58.3,大幅超过Gemini 3 Pro等国际大模型;在复杂场景(如电商网站、体感控制打气球游戏)中展现出色能力,电商场景下代码生成流畅,体感控制流程完整但精度待优化。
  • 技术机制革新:采用全新测试时扩展(Test-time Scaling)机制,提升推理性能同时更经济;通过“三步训练法”(工具使用微调、多样化任务强化、条件反射形成)增强工具结合能力,在复杂问题解决中展现“肌肉记忆”优势。

对比传统大模型,千问3在工具使用效率、代码工程直觉等方面展现“从工具到协作者”的跃迁,为国产AI发展带来新动力。

(作者 | Yoky | 邮箱 | yokyliu@pingwest.com)

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2026-01-28 11
    国产大模型在多领域表现优异,未来可期
  • 网友9 2026-01-28 11
    这样的模型发展让大家感受到科技的力量
  • 网友8 2026-01-28 11
    科技发展带来的改变让人兴奋,大模型时代来临
  • 网友7 2026-01-28 11
    对比国际大模型,国产千问有特色,很看好
  • 网友6 2026-01-28 11
    希望实际使用更稳定,现在测试有细节问题
  • 网友5 2026-01-28 11
    模型测试数据表现很震撼,技术实力强
  • 网友4 2026-01-28 11
    技术突破带来新体验,国产AI发展值得期待
  • 网友3 2026-01-28 11
    测试体感控制和代码生成很有意思,大模型越来越智能了
  • 网友2 2026-01-28 11
    参数这么大,评测成绩也亮眼,感觉很有潜力
  • 网友1 2026-01-28 11
    国产大模型进步真快,期待未来应用场景
查看“阿里发布千问Gemini3级模型,国产大模型性能再突破”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙