阿里发布千问Gemini3级模型,国产大模型性能再突破
(图片来自网络)
阿里发布千问Gemini3级模型,国产大模型性能再创佳绩
近日,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking,这款国产大模型在多项核心能力上展现突破,引发行业广泛关注。
- 参数与数据表现:总参数超万亿、预训练数据量高达36T Tokens,在科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项权威评测中刷新全球纪录。
- 核心能力突破:在数学推理AIME 25和HMMT 25上取得国内首个双满分,在“人类最后的测试”HLE中得分58.3,大幅超过Gemini 3 Pro等国际大模型;在复杂场景(如电商网站、体感控制打气球游戏)中展现出色能力,电商场景下代码生成流畅,体感控制流程完整但精度待优化。
- 技术机制革新:采用全新测试时扩展(Test-time Scaling)机制,提升推理性能同时更经济;通过“三步训练法”(工具使用微调、多样化任务强化、条件反射形成)增强工具结合能力,在复杂问题解决中展现“肌肉记忆”优势。
对比传统大模型,千问3在工具使用效率、代码工程直觉等方面展现“从工具到协作者”的跃迁,为国产AI发展带来新动力。
(作者 | Yoky | 邮箱 | yokyliu@pingwest.com)
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月28日:傅利叶结合脑机接口与具身智能 推出具身智能康复港
- 2026年1月28日:阿里云双线作战:一边烧钱一边突围
- 2026年1月28日:傅利叶公布‘1+3+X’具身智能生态战略布局
- 2026年1月28日:Omdia预测 存储成本上涨或抑制2026年智能手机AMOLED需求
- 2026年1月28日:10天随手写的AI,竟在GitHub狂飙7万星!「它开口那一刻,我吓懵了」
- 2026年1月28日:五年后南京苏州杭州宁波合肥:谁冲刺两万亿元?谁成AI第一城?
- 2026年1月28日:蚂蚁灵波开源具身大模型LingBot-VLA,跨本体跨任务泛化能力创新高
- 2026年1月28日:美团杀入万亿汽车市场,以流量破局外卖增长瓶颈
- 2026年1月28日:ClawdBot引发全球安全危机:CEO集体预警勿安装
- 2026年1月28日:内存涨价翻倍,iPhone变贵?天风郭明錤解析苹果新策略:承担成本抢份额,用服务赚回来
- 2026年1月28日:莱巴金娜横扫斯瓦泰克!澳网3年后再进四强
- 2026年1月28日:CBA常规赛前瞻:许利民解读赵睿斯佩尔曼复出,聚焦天津比赛
- 2026年1月28日:杨瀚森6中2仍稳固轮换!防守协作成球队关键,罚球联盟第一!
- 2026年1月28日:雷霆13连胜爆冲突!亚历山大29分锡安21+11锁定联盟第一
- 2026年1月28日:斯普利特点赞杨瀚森攻防两端,亲承增加上场时间,开拓者小将轮换价值获认可
- 2026年1月28日:外资变“姿势”拥抱中国:2025年外资数据呈现双变化 引发产业观察
- 2026年1月28日:阿里云通义开源Z-Image基座模型,生成图片拒绝AI‘大众脸’
- 2026年1月28日:华硕破晓Ultra轻薄本震撼发布:搭载酷睿Ultra X7、2.8K OLED触控屏
- 2026年1月28日:长城魏牌V9X旗舰SUV官宣,魏建军称‘保定人心中的大旗杆立起来了’
- 2026年1月28日:微软预计2030年数据中心用水近800亿升,承诺推进节水计划

精彩评论(10)