多模态视觉模型测评揭晓:文心4.5 Turbo并列国内第一
(图片来自网络)
8月29日,中文多模态视觉语言模型测评基准(SuperCLUE-VLM)8月榜单正式发布。百度ERNIE-4.5-Turbo-VL多模态大模型以66.47分成绩,在众多国内外模型中并列位居国内第一,在真实场景任务下的领先优势凸显。
本次评估纳入了Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等国内外15款多模态模型,从基础认知、视觉推理、视觉应用三大核心维度全面考察模型能力,贴近真实任务场景。
测评结果显示,Gemini-2.5-Pro以74.99分领先,OpenAI GPT-5(high)以68.59分位居第二,百度文心4.5 Turbo多模态模型以66.47分并列国内模型第一。有分析认为,文心大模型在多模态领域的多维度优势突出,国内头部模型在视觉推理、应用等高阶任务上进步明显,展现了中国在多模态大模型领域的潜力。
百度作为国内大模型产研企业,依托“芯片-框架-模型-应用”全栈自研体系持续推动文心大模型能力进化,飞桨文心的联合优化助力模型能力与效率提升。目前飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万,彰显了大模型在产业领域的应用价值。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年11月8日:讯飞用AI键打造市集式输入法,开启个性化表达新篇章
- 2025年11月8日:尤里奇回应与卢克曼冲突:事件解决后全队更团结
- 2025年11月8日:昨日社会热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日文化热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日科技热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日体育热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日娱乐热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日财经热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日教育热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日汽车热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:昨日健康热门资讯汇总-早报速览(2025-11-08)
- 2025年11月8日:杨浦滨江世界级博物馆开启‘人工智能+’技能文化新场景(开馆两周年)
- 2025年11月8日:三菱Eclipse跨界纯电汽车发布 搭载智能装甲设计 续航达600公里
- 2025年11月8日:微信集中行动:下架违规微短剧和关联小程序,守护平台清朗空间
- 2025年11月8日:美国学校部署AI监控工具 监测学生与聊天机器人对话以预防心理问题
- 2025年11月8日:医疗AI迎来“评审员”!北京启动医疗人工智能应用评测服务
- 2025年11月8日:“10后”职场变革:语音取代键盘或成趋势 研究预测语音沟通主流化
- 2025年11月8日:三星Galaxy S26标准版手机线稿曝光:6.9mm厚度 或成轻薄新标杆
- 2025年11月8日:英超焦点战:曼联2-2绝平热刺 末段绝杀成焦点
- 2025年11月8日:芝加哥大学团队发明「温度调节术」:让AI学会循序渐进思考问题

精彩评论(10)