阿里发布千问最强推理模型,性能比肩GPT-5.2
(图片来自网络)
阿里于1月26日晚发布千问旗舰推理模型 Qwen3-Max-Thinking,该模型在权威评测中创下了多项全球新纪录,性能可媲美GPT-5.2、Gemini 3 Pro等国际顶尖模型,是迄今为止国内最强的AI大模型之一。
据悉,该模型总参数量超万亿(1T),预训练数据量高达36T Tokens。在涵盖事实知识、复杂推理、指令遵循等19项大模型基准测试中,刷新了数项最佳表现(SOTA)纪录。
在技术创新层面,千问新模型采用了一种全新的 测试时扩展(Test-time Scaling) 机制,可对前推理结果进行“经验提取”式提炼,并据此进行多轮自我迭代,在相同上下文中实现更高效的推理计算,从而获得更智能的推理结果。在关键的“人类最后的测试”HLE中,千问得分达58.3,大幅超过GPT-5.2-Thinking(45.5分)与Gemini 3 Pro(45.8分),录得当前所有模型的最高分。
同时,模型还大幅增强了自主调用工具的原生Agent能力。在完成工具使用微调与大量多样化任务的联合强化学习训练后,Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。例如在QwenChat上,模型可自主选用搜索、个性化记忆和代码解释器等三个核心Agent工具功能,提供接近专业人士水平的回答,既合用户心意、更智能、更流畅,且模型幻觉也大为降低,为解决真实复杂任务打下基础。
目前,开发者、企业与普通用户可通过阿里云百炼获取新模型API服务,普通用户也可免费体验千问PC端、网页端及即将接入的千问APP,全方位感受千问最强模型的力量。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2026年1月27日:大S子女回北京过年 小箖箖露正脸似汪小菲 张兰全程陪伴游玩
- 2026年1月27日:乔任梁父母回应做账号原因 想延伸儿子品牌不让粉丝失望
- 2026年1月27日:罗威回归绿军主场首秀 球迷热情感谢送掌声
- 2026年1月27日:鲁尼盛赞卡里克执教:态度与团队精神焕新 曼联对比阿莫林变化显著
- 2026年1月27日:独行侠戴维斯交易概率降低,纳吉-马绍尔成交易市场热门球员
- 2026年1月27日:微电新能源拟登陆港交所 国泰海通担任独家保荐人
- 2026年1月27日:万孚生物推出尼帕病毒检测方案 提供灵活多元检测支持
- 2026年1月27日:Bigme大我B10彩墨屏办公本发布:天玑1080+安卓14系统亮相
- 2026年1月27日:英伟达20亿美元合作CoreWeave,AI数据中心建设加速
- 2026年1月27日:我国充电桩突破2000万个 新能源车主补能焦虑显著缓解
- 2026年1月27日:00后轻养生与拼多多:养生清单在电商平台跑出流行风潮
- 2026年1月27日:我国全超导用户磁体实现重大突破,中心磁场强度达地磁场70多万倍
- 2026年1月27日:华为无线鼠标Slim素皮版上架,可选‘发’‘财’字款售价169元
- 2026年1月27日:杨瀚森入选NBA全明星新秀赛 发展联盟代表队出战 小里弗斯任教练
- 2026年1月27日:马赛俱乐部就球迷客场禁令提出上诉,要求重新审议观赛决定
- 2026年1月27日:足球教练战术引争议 希勒批阿莫林傲慢并质疑卡里克主帅未来
- 2026年1月27日:200多斤的胖子能踢职业足球?传奇球员帕金的故事
- 2026年1月27日:11.77亿元!这家重卡新势力拿下自动驾驶开年最大融资
- 2026年1月27日:我国全超导用户磁体实现35.6特斯拉磁场强度 创全球最高纪录
- 2026年1月27日:人形机器人‘赛马’:宇树、银河通用、魔法原子等企业竞逐2026年春晚舞台

精彩评论(10)