PaddleOCR/models_list.md at 45dff759f8175e38ba798f8a15f743d10f581300

14 KiB

Raw Blame History

OCR模型列表（V2.0，2021年1月20日更新）

说明

2.0版模型和1.1版模型的主要区别在于动态图训练vs.静态图训练，模型性能上无明显差距。

本文档提供的是PPOCR自研模型列表，更多基于公开数据集的算法介绍与预训练模型可以参考：算法概览文档。

一、文本检测模型
二、文本识别模型
三、文本方向分类模型
四、Paddle-Lite 模型

PaddleOCR提供的可下载模型包括推理模型、训练模型、预训练模型、slim模型，模型区别说明如下：

模型类型	模型格式	简介
推理模型	inference.pdmodel、inference.pdiparams	用于预测引擎推理，详情
训练模型、预训练模型	.pdparams、.pdopt、*.states	训练过程中保存的模型的参数、优化器状态和训练中间信息，多用于模型指标评估和恢复训练
slim模型	*.nb	经过飞桨模型压缩工具PaddleSlim压缩后的模型，适用于移动端/IoT端等端侧部署场景（需使用飞桨Paddle Lite部署）。

各个模型的关系如下面的示意图所示。

一、文本检测模型

模型名称	模型简介	配置文件	推理模型大小	下载地址
ch_ppocr_mobile_slim_v2.0_det	slim裁剪版超轻量模型，支持中英文、多语种文本检测	ch_det_mv3_db_v2.0.yml	2.6M	推理模型
ch_ppocr_mobile_v2.0_det	原始超轻量模型，支持中英文、多语种文本检测	ch_det_mv3_db_v2.0.yml	3M	推理模型 / 训练模型
ch_ppocr_server_v2.0_det	通用模型，支持中英文、多语种文本检测，比超轻量模型更大，但效果更好	ch_det_res18_db_v2.0.yml	47M	推理模型 / 训练模型

二、文本识别模型

1. 中文识别模型

模型名称	模型简介	配置文件	推理模型大小	下载地址
ch_ppocr_mobile_slim_v2.0_rec	slim裁剪量化版超轻量模型，支持中英文、数字识别	rec_chinese_lite_train_v2.0.yml	6M	推理模型 / 训练模型
ch_ppocr_mobile_v2.0_rec	原始超轻量模型，支持中英文、数字识别	rec_chinese_lite_train_v2.0.yml	5.2M	推理模型 / 训练模型 / 预训练模型
ch_ppocr_server_v2.0_rec	通用模型，支持中英文、数字识别	rec_chinese_common_train_v2.0.yml	94.8M	推理模型 / 训练模型 / 预训练模型

说明： 训练模型是基于预训练模型在真实数据与竖排合成文本数据上finetune得到的模型，在真实应用场景中有着更好的表现，预训练模型则是直接基于全量真实数据与合成数据训练得到，更适合用于在自己的数据集上finetune。

2. 英文识别模型

模型名称	模型简介	配置文件	推理模型大小	下载地址
en_number_mobile_slim_v2.0_rec	slim裁剪量化版超轻量模型，支持英文、数字识别	rec_en_number_lite_train.yml	2.7M	推理模型 / 训练模型
en_number_mobile_v2.0_rec	原始超轻量模型，支持英文、数字识别	rec_en_number_lite_train.yml	2.6M	推理模型 / 训练模型

3. 多语言识别模型（更多语言持续更新中...）

说明： 新增的多语言模型的配置文件通过代码方式生成，您可以通过--help参数查看当前PaddleOCR支持生成哪些多语言的配置文件：

# 该代码需要在指定目录运行
cd {your/path/}PaddleOCR/configs/rec/multi_language/
python3 generate_multi_language_configs.py --help

下面以生成意大利语配置文件为例：

1. 生成意大利语配置文件测试现有模型

如果您仅仅想用配置文件测试PaddleOCR提供的多语言模型可以通过下面命令生成默认的配置文件，使用PaddleOCR提供的小语种字典进行预测。

# 该代码需要在指定目录运行
cd {your/path/}PaddleOCR/configs/rec/multi_language/
# 通过-l或者--language参数设置需要生成的语种的配置文件，该命令会将默认参数写入配置文件
python3 generate_multi_language_configs.py -l it

2. 生成意大利语配置文件训练自己的数据

如果您想训练自己的小语种模型，可以准备好训练集文件、验证集文件、字典文件和训练数据路径，这里假设准备的意大利语的训练集、验证集、字典和训练数据路径为：

训练集:{your/path/}PaddleOCR/train_data/train_list.txt
验证集:{your/path/}PaddleOCR/train_data/val_list.txt
使用PaddleOCR提供的默认字典：{your/path/}PaddleOCR/ppocr/utils/dict/it_dict.txt
训练数据路径:{your/path/}PaddleOCR/train_data

使用以下命令生成配置文件：

# 该代码需要在指定目录运行
cd {your/path/}PaddleOCR/configs/rec/multi_language/
# -l或者--language字段是必须的
# --train修改训练集，--val修改验证集，--data_dir修改数据集目录，-o修改对应默认参数
# --dict命令改变字典路径，示例使用默认字典路径则该参数可不填
python3 generate_multi_language_configs.py -l it \
--train train_data/train_list.txt \
--val train_data/val_list.txt \
--data_dir train_data \
-o Global.use_gpu=False

3. 多语言模型与配置文件

模型名称	字典文件	模型简介	配置文件	推理模型大小	下载地址
french_mobile_v2.0_rec	ppocr/utils/dict/french_dict.txt	法文识别	rec_french_lite_train.yml	2.65M	推理模型 / 训练模型
german_mobile_v2.0_rec	ppocr/utils/dict/german_dict.txt	德文识别	rec_german_lite_train.yml	2.65M	推理模型 / 训练模型
korean_mobile_v2.0_rec	ppocr/utils/dict/korean_dict.txt	韩文识别	rec_korean_lite_train.yml	3.9M	推理模型 / 训练模型
japan_mobile_v2.0_rec	ppocr/utils/dict/japan_dict.txt	日文识别	rec_japan_lite_train.yml	4.23M	推理模型 / 训练模型
chinese_cht_mobile_v2.0_rec	ppocr/utils/dict/chinese_cht_dict.txt	中文繁体识别	rec_chinese_cht_lite_train.yml	5.63M	推理模型 / 训练模型
te_mobile_v2.0_rec	ppocr/utils/dict/te_dict.txt	泰卢固文识别	rec_te_lite_train.yml	2.63M	推理模型 / 训练模型
ka_mobile_v2.0_rec	ppocr/utils/dict/ka_dict.txt	卡纳达文识别	rec_ka_lite_train.yml	2.63M	推理模型 / 训练模型
ta_mobile_v2.0_rec	ppocr/utils/dict/ta_dict.txt	泰米尔文识别	rec_ta_lite_train.yml	2.63M	推理模型 / 训练模型
latin_mobile_v2.0_rec	ppocr/utils/dict/latin_dict.txt	拉丁文识别	rec_latin_lite_train.yml	2.6M	推理模型 / 训练模型
arabic_mobile_v2.0_rec	ppocr/utils/dict/arabic_dict.txt	阿拉伯字母	rec_arabic_lite_train.yml	2.6M	推理模型 / 训练模型
cyrillic_mobile_v2.0_rec	ppocr/utils/dict/cyrillic_dict.txt	斯拉夫字母	rec_cyrillic_lite_train.yml	2.6M	推理模型 / 训练模型
devanagari_mobile_v2.0_rec	ppocr/utils/dict/devanagari_dict.txt	梵文字母	rec_devanagari_lite_train.yml	2.6M	推理模型 / 训练模型

更多支持语种请参考: 多语言模型

三、文本方向分类模型

模型名称	模型简介	配置文件	推理模型大小	下载地址
ch_ppocr_mobile_slim_v2.0_cls	slim量化版模型	cls_mv3.yml	2.1M	推理模型 / 训练模型
ch_ppocr_mobile_v2.0_cls	原始模型	cls_mv3.yml	1.38M	推理模型 / 训练模型

四、Paddle-Lite 模型

模型版本	模型简介	模型大小	检测模型	文本方向分类模型	识别模型	Paddle-Lite版本
V2.0	超轻量中文OCR 移动端模型	7.8M	下载地址	下载地址	下载地址	v2.9
V2.0(slim)	超轻量中文OCR 移动端模型	3.3M	下载地址	下载地址	下载地址	v2.9

14 KiB Raw Blame History Unescape Escape