百度发布新一代文字识别AI模型PP-OCRv5,参数量仅0.07B

(图片来自网络)
IT 之家 9 月 13 日消息,百度于 9 月 10 日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。百度介绍称,PP-OCRv5 是专为缓解大型视觉语言模型(VLMs)局限性设计的专用 OCR 模型,提供高效、准确且轻量级的文字识别方案。
PP-OCRv5 亮点丰富:
- 效率:模型参数量仅为 0.07B,能在 CPU 和边缘设备上高效运行,移动版本在英特尔 Xeon Gold 6271C CPU 上每秒处理超 370 个字符
- 性能:在 OCR 基准测试中优于通用型 VLM 模型,支持手写、印刷中英文及拼音文本
- 定位:提供精确文本行边界框坐标,助力结构化数据提取
- 多语言:支持简体、繁体、英文等五种文字类型,覆盖超 40 种语言
该模型由图像预处理、文本检测、文本行方向、文本识别四个核心组件构成,分别处理图像标准化、文本位置识别、方向分类、字符解码。
IT 之家附 PP-OCRv5 下载地址信息。
(声明:该内容经AI精编)
查看原网页
最新新闻
- 2025年9月13日:二手机贩子新套路瞄准儿童零花钱 存在消费陷阱
- 2025年9月13日:DeepMind科学掌门人首次揭秘:拿完诺奖只是开始,终极目标是打造「科学API」,让人人都能搞科研
- 2025年9月13日:甲骨文股价暴涨带动AI供应链热潮 中国供应链企业迎红利
- 2025年9月13日:大众平价电动车核心技术升级:自研电机与耐用电池加持
- 2025年9月13日:AI大模型现“见机行事”:技术优化与体验变化
- 2025年9月13日:张禹珍4-2挫德国劲敌,锁定与王楚钦半决赛
- 2025年9月13日:WTT澳门冠军赛男单1/4决赛:雨果鏖战6局击败弗朗西斯卡进半决赛
- 2025年9月13日:西甲对决:姆巴佩断球反击建功,4场4球领跑射手榜,3次皇社收获3球
- 2025年9月13日:姆巴佩传射助皇马2 - 1逆转皇社,当选本场比赛最佳球员
- 2025年9月13日:孙颖莎逆转夺冠 以4 - 1晋级女单4强
- 2025年9月13日:国宝画重点|“汉代四绝”里藏着的文化密码
- 2025年9月13日:服贸会展现‘数智’与‘金融’双向奔赴,金融服务创新图景
- 2025年9月13日:财政政策积极有为 推动经济质效提升
- 2025年9月13日:191423亿元创新高!文化产业活力彰显经济新引擎
- 2025年9月13日:经贸盛会连台,展现开放创新合作大势
- 2025年9月13日:令人身心俱疲的焦虑,该如何化解 | 科普时间
- 2025年9月13日:2025金熊猫国际文化论坛启动全球影像合作计划,以“文明共聚 开创未来”为主题
- 2025年9月13日:以夜空为屏,武汉为长江举办2025长江文化艺术季开幕式
- 2025年9月13日:免签来华是种什么体验?听听这些外宾怎么说
- 2025年9月13日:从‘有学上’到‘上好学’:‘十四五’时期教育财政支持成果显著
精彩评论(10)