关于本站登录

百度发布新一代文字识别AI模型PP-OCRv5，参数量仅0.07B

2025年9月13日

（图片来自网络）

IT 之家 9 月 13 日消息，百度于 9 月 10 日在 Hugging Face 发布新一代文字识别解决方案 PP-OCRv5。百度介绍称，PP-OCRv5 是专为缓解大型视觉语言模型（VLMs）局限性设计的专用 OCR 模型，提供高效、准确且轻量级的文字识别方案。

PP-OCRv5 亮点丰富：

效率：模型参数量仅为 0.07B，能在 CPU 和边缘设备上高效运行，移动版本在英特尔 Xeon Gold 6271C CPU 上每秒处理超 370 个字符

性能：在 OCR 基准测试中优于通用型 VLM 模型，支持手写、印刷中英文及拼音文本

定位：提供精确文本行边界框坐标，助力结构化数据提取

多语言：支持简体、繁体、英文等五种文字类型，覆盖超 40 种语言

该模型由图像预处理、文本检测、文本行方向、文本识别四个核心组件构成，分别处理图像标准化、文本位置识别、方向分类、字符解码。

IT 之家附 PP-OCRv5 下载地址信息。

（声明：该内容经AI精编）查看原网页

精彩评论（10）

网友10 2025-09-13 23

新AI模型参数小还高效，以后处理文件、文字提取都轻松，太方便了~
网友9 2025-09-13 23

家里用手机扫说明书、发票，这个模型准不准？希望实用方便~
网友8 2025-09-13 23

从技术角度看，模块化设计和参数优化做得不错，对未来AI在边缘设备应用有启发~
网友7 2025-09-13 23

以后写作业扫题、做笔记都用上这个，学习更便捷啦~
网友6 2025-09-13 23

对职场办公来说，轻量OCR模型能提升效率，这个参数小适合设备受限的情况~
网友5 2025-09-13 23

这个模型好用，识别文字快，适合老人用手机读新闻~
网友4 2025-09-13 23

能识别那么多种文字，感觉未来用起来很方便，想试试~
网友3 2025-09-13 23

作为技术人员，PP-OCRv5在效率与准确率的平衡很值得研究，对行业有推动作用~
网友2 2025-09-13 23

0.07B参数量很厉害，以后用手机扫文字速度快很多，科技发展真快~
网友1 2025-09-13 23

这个AI模型对办公很有帮助，参数小还能在老设备上用，方便很多~

查看“百度发布新一代文字识别AI模型PP-OCRv5，参数量仅0.07B”相关搜索 >

最新新闻

An unhandled error has occurred. Reload 🗙