多模态视觉模型测评揭晓:文心4.5 Turbo并列国内第一

2025年8月29日
news

(图片来自网络)

8月29日,中文多模态视觉语言模型测评基准(SuperCLUE-VLM)8月榜单正式发布。百度ERNIE-4.5-Turbo-VL多模态大模型以66.47分成绩,在众多国内外模型中并列位居国内第一,在真实场景任务下的领先优势凸显。

本次评估纳入了Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5(high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest等国内外15款多模态模型,从基础认知、视觉推理、视觉应用三大核心维度全面考察模型能力,贴近真实任务场景。

测评结果显示,Gemini-2.5-Pro以74.99分领先,OpenAI GPT-5(high)以68.59分位居第二,百度文心4.5 Turbo多模态模型以66.47分并列国内模型第一。有分析认为,文心大模型在多模态领域的多维度优势突出,国内头部模型在视觉推理、应用等高阶任务上进步明显,展现了中国在多模态大模型领域的潜力。

百度作为国内大模型产研企业,依托“芯片-框架-模型-应用”全栈自研体系持续推动文心大模型能力进化,飞桨文心的联合优化助力模型能力与效率提升。目前飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万,彰显了大模型在产业领域的应用价值。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-08-29 15
    模型现在能做啥,以后能帮到生活哪方面,感觉很有用。
  • 网友9 2025-08-29 15
    多模态大模型发展迅速,这次评测展现了各模型竞争力,未来值得期待。
  • 网友8 2025-08-29 15
    需要关注模型在中文场景下的优化,这次测评结果不错,期待持续发展。
  • 网友7 2025-08-29 15
    从评测维度看,模型真实场景能力提升,体现了技术进步,值得关注。
  • 网友6 2025-08-29 15
    多模态模型评测结果出来了,文心表现不错,期待更多创新功能!
  • 网友5 2025-08-29 15
    以后用这些模型做作业、学习可能更方便,科技发展真好。
  • 网友4 2025-08-29 15
    多模态模型在真实任务中表现好,说明技术实用化进步,未来应用空间大。
  • 网友3 2025-08-29 15
    这些模型以后在办公、处理资料方面能帮大忙,很期待用上。
  • 网友2 2025-08-29 15
    大模型在多模态方面进步明显,以后学习、工作可能更高效,科技改变生活很棒。
  • 网友1 2025-08-29 15
    这个技术发展很快,感觉以后用起来更方便了,希望以后服务更多领域。
查看“多模态视觉模型测评揭晓:文心4.5 Turbo并列国内第一”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙