14 KiB
14 KiB
OCR模型列表(V2.0,2021年1月20日更新)
说明
PaddleOCR提供的可下载模型包括推理模型
、训练模型
、预训练模型
、slim模型
,模型区别说明如下:
模型类型 | 模型格式 | 简介 |
---|---|---|
推理模型 | inference.pdmodel、inference.pdiparams | 用于预测引擎推理,详情 |
训练模型、预训练模型 | *.pdparams、*.pdopt、*.states | 训练过程中保存的模型的参数、优化器状态和训练中间信息,多用于模型指标评估和恢复训练 |
slim模型 | *.nb | 经过飞桨模型压缩工具PaddleSlim压缩后的模型,适用于移动端/IoT端等端侧部署场景(需使用飞桨Paddle Lite部署)。 |
各个模型的关系如下面的示意图所示。
一、文本检测模型
模型名称 | 模型简介 | 配置文件 | 推理模型大小 | 下载地址 |
---|---|---|---|---|
ch_ppocr_mobile_slim_v2.0_det | slim裁剪版超轻量模型,支持中英文、多语种文本检测 | ch_det_mv3_db_v2.0.yml | 2.6M | 推理模型 |
ch_ppocr_mobile_v2.0_det | 原始超轻量模型,支持中英文、多语种文本检测 | ch_det_mv3_db_v2.0.yml | 3M | 推理模型 / 训练模型 |
ch_ppocr_server_v2.0_det | 通用模型,支持中英文、多语种文本检测,比超轻量模型更大,但效果更好 | ch_det_res18_db_v2.0.yml | 47M | 推理模型 / 训练模型 |
二、文本识别模型
1. 中文识别模型
模型名称 | 模型简介 | 配置文件 | 推理模型大小 | 下载地址 |
---|---|---|---|---|
ch_ppocr_mobile_slim_v2.0_rec | slim裁剪量化版超轻量模型,支持中英文、数字识别 | rec_chinese_lite_train_v2.0.yml | 6M | 推理模型 / 训练模型 |
ch_ppocr_mobile_v2.0_rec | 原始超轻量模型,支持中英文、数字识别 | rec_chinese_lite_train_v2.0.yml | 5.2M | 推理模型 / 训练模型 / 预训练模型 |
ch_ppocr_server_v2.0_rec | 通用模型,支持中英文、数字识别 | rec_chinese_common_train_v2.0.yml | 94.8M | 推理模型 / 训练模型 / 预训练模型 |
说明: 训练模型
是基于预训练模型在真实数据与竖排合成文本数据上finetune得到的模型,在真实应用场景中有着更好的表现,预训练模型
则是直接基于全量真实数据与合成数据训练得到,更适合用于在自己的数据集上finetune。
2. 英文识别模型
模型名称 | 模型简介 | 配置文件 | 推理模型大小 | 下载地址 |
---|---|---|---|---|
en_number_mobile_slim_v2.0_rec | slim裁剪量化版超轻量模型,支持英文、数字识别 | rec_en_number_lite_train.yml | 2.7M | 推理模型 / 训练模型 |
en_number_mobile_v2.0_rec | 原始超轻量模型,支持英文、数字识别 | rec_en_number_lite_train.yml | 2.6M | 推理模型 / 训练模型 |
3. 多语言识别模型(更多语言持续更新中...)
说明: 新增的多语言模型的配置文件通过代码方式生成,您可以通过--help
参数查看当前PaddleOCR支持生成哪些多语言的配置文件:
# 该代码需要在指定目录运行
cd {your/path/}PaddleOCR/configs/rec/multi_language/
python3 generate_multi_language_configs.py --help
下面以生成意大利语配置文件为例:
1. 生成意大利语配置文件测试现有模型
如果您仅仅想用配置文件测试PaddleOCR提供的多语言模型可以通过下面命令生成默认的配置文件,使用PaddleOCR提供的小语种字典进行预测。
# 该代码需要在指定目录运行
cd {your/path/}PaddleOCR/configs/rec/multi_language/
# 通过-l或者--language参数设置需要生成的语种的配置文件,该命令会将默认参数写入配置文件
python3 generate_multi_language_configs.py -l it
2. 生成意大利语配置文件训练自己的数据
如果您想训练自己的小语种模型,可以准备好训练集文件、验证集文件、字典文件和训练数据路径,这里假设准备的意大利语的训练集、验证集、字典和训练数据路径为:
- 训练集:{your/path/}PaddleOCR/train_data/train_list.txt
- 验证集:{your/path/}PaddleOCR/train_data/val_list.txt
- 使用PaddleOCR提供的默认字典:{your/path/}PaddleOCR/ppocr/utils/dict/it_dict.txt
- 训练数据路径:{your/path/}PaddleOCR/train_data
使用以下命令生成配置文件:
# 该代码需要在指定目录运行
cd {your/path/}PaddleOCR/configs/rec/multi_language/
# -l或者--language字段是必须的
# --train修改训练集,--val修改验证集,--data_dir修改数据集目录,-o修改对应默认参数
# --dict命令改变字典路径,示例使用默认字典路径则该参数可不填
python3 generate_multi_language_configs.py -l it \
--train train_data/train_list.txt \
--val train_data/val_list.txt \
--data_dir train_data \
-o Global.use_gpu=False
3. 多语言模型与配置文件
模型名称 | 字典文件 | 模型简介 | 配置文件 | 推理模型大小 | 下载地址 |
---|---|---|---|---|---|
french_mobile_v2.0_rec | ppocr/utils/dict/french_dict.txt | 法文识别 | rec_french_lite_train.yml | 2.65M | 推理模型 / 训练模型 |
german_mobile_v2.0_rec | ppocr/utils/dict/german_dict.txt | 德文识别 | rec_german_lite_train.yml | 2.65M | 推理模型 / 训练模型 |
korean_mobile_v2.0_rec | ppocr/utils/dict/korean_dict.txt | 韩文识别 | rec_korean_lite_train.yml | 3.9M | 推理模型 / 训练模型 |
japan_mobile_v2.0_rec | ppocr/utils/dict/japan_dict.txt | 日文识别 | rec_japan_lite_train.yml | 4.23M | 推理模型 / 训练模型 |
chinese_cht_mobile_v2.0_rec | ppocr/utils/dict/chinese_cht_dict.txt | 中文繁体识别 | rec_chinese_cht_lite_train.yml | 5.63M | 推理模型 / 训练模型 |
te_mobile_v2.0_rec | ppocr/utils/dict/te_dict.txt | 泰卢固文识别 | rec_te_lite_train.yml | 2.63M | 推理模型 / 训练模型 |
ka_mobile_v2.0_rec | ppocr/utils/dict/ka_dict.txt | 卡纳达文识别 | rec_ka_lite_train.yml | 2.63M | 推理模型 / 训练模型 |
ta_mobile_v2.0_rec | ppocr/utils/dict/ta_dict.txt | 泰米尔文识别 | rec_ta_lite_train.yml | 2.63M | 推理模型 / 训练模型 |
latin_mobile_v2.0_rec | ppocr/utils/dict/latin_dict.txt | 拉丁文识别 | rec_latin_lite_train.yml | 2.6M | 推理模型 / 训练模型 |
arabic_mobile_v2.0_rec | ppocr/utils/dict/arabic_dict.txt | 阿拉伯字母 | rec_arabic_lite_train.yml | 2.6M | 推理模型 / 训练模型 |
cyrillic_mobile_v2.0_rec | ppocr/utils/dict/cyrillic_dict.txt | 斯拉夫字母 | rec_cyrillic_lite_train.yml | 2.6M | 推理模型 / 训练模型 |
devanagari_mobile_v2.0_rec | ppocr/utils/dict/devanagari_dict.txt | 梵文字母 | rec_devanagari_lite_train.yml | 2.6M | 推理模型 / 训练模型 |
更多支持语种请参考: 多语言模型
三、文本方向分类模型
模型名称 | 模型简介 | 配置文件 | 推理模型大小 | 下载地址 |
---|---|---|---|---|
ch_ppocr_mobile_slim_v2.0_cls | slim量化版模型 | cls_mv3.yml | 2.1M | 推理模型 / 训练模型 |
ch_ppocr_mobile_v2.0_cls | 原始模型 | cls_mv3.yml | 1.38M | 推理模型 / 训练模型 |
四、Paddle-Lite 模型
模型版本 | 模型简介 | 模型大小 | 检测模型 | 文本方向分类模型 | 识别模型 | Paddle-Lite版本 |
---|---|---|---|---|---|---|
V2.0 | 超轻量中文OCR 移动端模型 | 7.8M | 下载地址 | 下载地址 | 下载地址 | v2.9 |
V2.0(slim) | 超轻量中文OCR 移动端模型 | 3.3M | 下载地址 | 下载地址 | 下载地址 | v2.9 |