阿里Qwen3系列最强推理模型亮相,数学考试满分,测试成token‘吞金兽’
(图片来自网络)
智东西报道,阿里近日发布Qwen 3系列中最强推理模型——Qwen3-Max-Thinking的早期预览版。尽管仅作为训练中间检查点,该模型已在AIME 2025、HMMT等具有挑战性的推理基准测试中实现100%准确率,展现出强大的数学与推理能力。
Qwen团队在通义千问负责人林俊旸个人社交媒体账号“超前点映”后,未公开该模型的更多细节及开源信息,但用户可通过Qwen Chat和阿里云API试用该早期预览版。该模型实现了思考模式与非思考模式的有效融合,在思考模式下,智能体编程、常识推理,以及数学、科学和通用领域推理能力等方面均有显著提升。
核心亮点:Qwen3-Max-Thinking早期预览版在数学竞赛(如AIME 2025)中取得满分表现;但测试过程中展现出高token消耗特性,被称为“token‘吞金兽’”——在完成推理任务时消耗大量token,用户需关注使用成本。
在具体体验中,该模型在数学难题、智能体编程等任务上表现亮眼,但在token消耗方面需注意。用户可通过模型自带“思考预算控件”,在1024 - 81920个token的区间内调整推理长度,以管理成本。
阿里未公布完整的基准测试结果,Qwen3-Max系列定位为面向高难度推理场景的模型,未来版本仍在持续优化中。
(声明:该内容经AI精编)
                
                    查看原网页
                
最新新闻
- 2025年11月4日:影石刘靖康回应大疆价格战:市场扩容与企业战略调整
 - 2025年11月4日:彭博社曝苹果自研AI遇挫 付费请谷歌定制Siri核心模型
 - 2025年11月4日:前特斯拉核心成员携中国供应链再创业,挑战人形机器人新势力
 - 2025年11月4日:全球首个AI投资大赛结果出炉:阿里千问夺冠,美国四大模型均亏损
 - 2025年11月4日:22岁初创团队成最年轻科技亿万富翁 Mercor引领AI领域招聘创新
 - 2025年11月4日:饿了么变更名为淘宝闪购 骑手同步更换橙黑新工服
 - 2025年11月4日:成都蓉城客场挑战首尔队 亚冠赛林加德首发韦世豪替补出战
 - 2025年11月4日:NBA快船负于热火!泰伦卢试阵、战术问题引众怒,错失绝杀机会
 - 2025年11月4日:欧洲智库聚焦:中国‘十五五’规划为欧中绿色合作指明方向
 - 2025年11月4日:【有理有句】“简”述千年,品“牍”时代
 - 2025年11月4日:第八届进博会倒计时 记者探营国家会展中心筹备现场
 - 2025年11月4日:人民日报看新疆 | 产业集聚,打造对外开放新高地
 - 2025年11月4日:校馆弦歌:榜样力量引领,科学精神与报国理想薪火相传
 - 2025年11月4日:第八届进博会完成布展 展品与展区就位迎接全球嘉宾
 - 2025年11月4日:好吃又好逛,全运会倒计时,一起玩转大湾区!
 - 2025年11月4日:视频丨‘剧透’来了 今年进博会有哪些特色和亮点?
 - 2025年11月4日:人民财评:构建以先进制造业为骨干的现代化产业体系
 - 2025年11月4日:一滴水的增值:从绿水青山到金山银山
 - 2025年11月4日:骁龙下一代旗舰芯片前瞻:基于台积电N2p工艺,架构调整引行业关注
 - 2025年11月4日:双11首周"中式养生"海外爆红,淘宝大健康行业加速出海
 

精彩评论(10)