PaddleOCR工具库v3.0.1

作者：袖梨 2026-06-05

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

PP-OCR是一个实用的超轻量OCR系统。主要由DB文本检测、检测框矫正和CRNN文本识别三部分组成。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面，采用19个有效策略，对各个模块的模型进行效果调优和瘦身，最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。

特性：

1、PPOCR系列高质量预训练模型，准确的识别效果

超轻量ppocr_mobile移动端系列：检测（2.6M）+方向分类器（0.9M）+ 识别（4.6M）= 8.1M

通用ppocr_server系列：检测（47.2M）+方向分类器（0.9M）+ 识别（107M）= 155.1M

超轻量压缩ppocr_mobile_slim系列：检测（1.4M）+方向分类器（0.5M）+ 识别（1.6M）= 3.5M

2、支持中英文数字组合识别、竖排文本识别、长文本识别

3、支持多语言识别：韩语、日语、德语、法语

4、支持用户自定义训练，提供丰富的预测推理部署方案

5、支持PIP快速安装使用

6、可运行于Linux、Windows、MacOS等多种系统

PaddleOCR 3.0新增三大特色能力：

?️全场景文字识别模型PP-OCRv5：单模型支持五种文字类型和复杂手写体识别；整体识别精度相比上一代提升13个百分点。

?通用文档解析方案PP-StructureV3：支持多场景、多版式 PDF 高精度解析，在公开评测集中领先众多开源和闭源方案。

?智能文档理解方案PP-ChatOCRv4：原生支持文心大模型4.5 Turbo，精度相比上一代提升15个百分点。

PaddleOCR工具库 v3.0.1

相关文章

精彩推荐