百度发布新一代文字识别AI模型PP-OCRv5,参数量仅0.07B

2025年9月13日
news

(图片来自网络)

IT 之家 9 月 13 日消息,百度于 9 月 10 日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。百度介绍称,PP-OCRv5 是专为缓解大型视觉语言模型(VLMs)局限性设计的专用 OCR 模型,提供高效、准确且轻量级的文字识别方案。


PP-OCRv5 亮点丰富:



  • 效率:模型参数量仅为 0.07B,能在 CPU 和边缘设备上高效运行,移动版本在英特尔 Xeon Gold 6271C CPU 上每秒处理超 370 个字符

  • 性能:在 OCR 基准测试中优于通用型 VLM 模型,支持手写、印刷中英文及拼音文本

  • 定位:提供精确文本行边界框坐标,助力结构化数据提取

  • 多语言:支持简体、繁体、英文等五种文字类型,覆盖超 40 种语言


该模型由图像预处理、文本检测、文本行方向、文本识别四个核心组件构成,分别处理图像标准化、文本位置识别、方向分类、字符解码。


IT 之家附 PP-OCRv5 下载地址信息。

(声明:该内容经AI精编) 查看原网页

精彩评论(10)

  • 网友10 2025-09-13 23
    新AI模型参数小还高效,以后处理文件、文字提取都轻松,太方便了~
  • 网友9 2025-09-13 23
    家里用手机扫说明书、发票,这个模型准不准?希望实用方便~
  • 网友8 2025-09-13 23
    从技术角度看,模块化设计和参数优化做得不错,对未来AI在边缘设备应用有启发~
  • 网友7 2025-09-13 23
    以后写作业扫题、做笔记都用上这个,学习更便捷啦~
  • 网友6 2025-09-13 23
    对职场办公来说,轻量OCR模型能提升效率,这个参数小适合设备受限的情况~
  • 网友5 2025-09-13 23
    这个模型好用,识别文字快,适合老人用手机读新闻~
  • 网友4 2025-09-13 23
    能识别那么多种文字,感觉未来用起来很方便,想试试~
  • 网友3 2025-09-13 23
    作为技术人员,PP-OCRv5在效率与准确率的平衡很值得研究,对行业有推动作用~
  • 网友2 2025-09-13 23
    0.07B参数量很厉害,以后用手机扫文字速度快很多,科技发展真快~
  • 网友1 2025-09-13 23
    这个AI模型对办公很有帮助,参数小还能在老设备上用,方便很多~
查看“百度发布新一代文字识别AI模型PP-OCRv5,参数量仅0.07B”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙