百度开源视觉理解模型Qianfan-VL 多模态能力革新

(图片来自网络)
近日,百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL,并全面开源!该系列包含3B、8B和70B三个尺寸版本,是面向企业级多模态应用场景进行深度优化的视觉理解大模型。
Qianfan-VL不仅具备出色的基础通用能力,还针对产业落地中的高频需求,如OCR和教育垂直场景做了专项强化,使其在实际应用中表现更加卓越。
该系列模型由百度智能云千帆模型研发团队基于开源模型开发,并在百度自研昆仑芯P800芯片上完成全流程计算任务。昆仑芯P800提供了强大算力,确保模型高效处理海量数据和复杂算法,支持单任务5000卡规模并行计算,优化模型效率与性能。
Qianfan-VL模型具备三大特点:
- 多尺寸模型满足不同场景需求:提供3B、8B、70B三种规格模型,覆盖不同规模企业和开发者需求。
- 提供思考推理能力:8B和70B模型支持通过特殊token激活思维链能力,覆盖复杂图表理解、视觉推理、数学解题等多场景。
- OCR与文档理解能力增强:主打OCR全场景识别和复杂版面文档理解,在基准测试中表现优异,提供高精度视觉理解解决方案。
在通用能力、OCR与文档理解、数学解题等基准测试中,Qianfan-VL系列模型(3B、8B、70B)均展现出优异表现,通用能力、垂类任务均达SOTA水平。模型架构设计结合先进多模态架构、四阶段训练、数据合成管线等技术,配合昆仑芯实现高效计算,为AI技术落地提供支持。
目前Qianfan-VL已开源,即日起至10月10日可在百度智能云千帆平台免费体验8B、70B模型,详情可查看相关链接。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年9月23日:昨日社会热门资讯汇总-早报速览(2025-09-23)
- 2025年9月23日:昨日科技热门资讯汇总-早报速览(2025-09-23)
- 2025年9月23日:昨日体育热门资讯汇总-早报速览(2025-09-23)
- 2025年9月23日:昨日财经热门资讯汇总-早报速览(2025-09-23)
- 2025年9月22日:全球顶尖智库发布年度“科创先锋榜”,告诉你中国科技何以崛起
- 2025年9月22日:2025年女足金球奖前十榜单揭晓 邦马蒂居首卡尔登泰鲁索分列二三位
- 2025年9月22日:英伟达1000亿美元投资助OpenAI建10GW数据中心,AI基建迎来新里程碑
- 2025年9月22日:意大利国家队官宣:多纳鲁马获雅辛奖+金球奖排第九 恭喜门神
- 2025年9月22日:沙特国王杯首轮:利雅得新月1-0战胜哈萨正义 阿卜杜拉-哈姆丹制胜
- 2025年9月22日:亚马尔荣膺双料科帕奖 成足球界首位两度获奖球员
- 2025年9月22日:DeepSeek-V3.1「终极版」重磅发布!性能提升超36%,V4/R2版本引期待?
- 2025年9月22日:雅辛成足球史唯一获金球奖门将,50余年无来者
- 2025年9月22日:抢票加速包到底管不管用?江苏消保委调查结果公布
- 2025年9月22日:2024-25赛季意甲麦克托米奈打破僵次数领跑 帮助那不勒斯夺冠军
- 2025年9月22日:苹果公司计划在阿拉伯联合酋长国开设第五家零售店
- 2025年9月22日:可折叠iPhone新爆料:类似‘两台钛金属iPhone Air并排放置’
- 2025年9月22日:苹果iPhone 17系列发售:苹果开始回击国产手机竞争
- 2025年9月22日:重庆队官宣解雇主帅萨尔瓦多 率队中甲第2后下课 张外龙或接任
- 2025年9月22日:阿森纳赖斯欧冠任意球双响 获金球奖第27名 生涯第二次提名
- 2025年9月22日:昨日社会热门资讯汇总-早报速览(2025-09-22)
精彩评论(10)