PaddleOCR/algorithm_overview.md at f4d2ebcb3ab407cb95778a1afb6c9fe6ccbfb3c4

算法介绍

PaddleOCR开源的文本检测算法列表：

在ICDAR2015文本检测公开数据集上，算法效果如下：

模型	骨干网络	precision	recall	Hmean	下载链接
EAST	ResNet50_vd	88.18%	85.51%	86.82%	下载链接
EAST	MobileNetV3	81.67%	79.83%	80.74%	下载链接
DB	ResNet50_vd	83.79%	80.65%	82.19%	下载链接
DB	MobileNetV3	75.92%	73.18%	74.53%	下载链接
SAST	ResNet50_vd	92.18%	82.96%	87.33%	下载链接

在Total-text文本检测公开数据集上，算法效果如下：

模型	骨干网络	precision	recall	Hmean	下载链接
SAST	ResNet50_vd	88.74%	79.80%	84.03%	下载链接

说明： SAST模型训练额外加入了icdar2013、icdar2017、COCO-Text、ArT等公开数据集进行调优。PaddleOCR用到的经过整理格式的英文公开数据集下载：百度云地址 (提取码: 2bpi)

使用LSVT街景数据集共3w张数据，训练中文检测模型的相关配置和预训练文件如下：

模型	骨干网络	配置文件	预训练模型
超轻量中文模型	MobileNetV3	det_mv3_db.yml	下载链接
通用中文OCR模型	ResNet50_vd	det_r50_vd_db.yml	下载链接

注：上述DB模型的训练和评估，需设置后处理参数box_thresh=0.6，unclip_ratio=1.5，使用不同数据集、不同模型训练，可调整这两个参数进行优化

PaddleOCR文本检测算法的训练和使用请参考文档教程中模型训练/评估中的文本检测部分。

PaddleOCR开源的文本识别算法列表：

参考DTRB文字识别训练和评估流程，使用MJSynth和SynthText两个文字识别数据集训练，在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上进行评估，算法效果如下：

模型	骨干网络	Avg Accuracy	模型存储命名	下载链接
Rosetta	Resnet34_vd	80.24%	rec_r34_vd_none_none_ctc	下载链接
Rosetta	MobileNetV3	78.16%	rec_mv3_none_none_ctc	下载链接
CRNN	Resnet34_vd	82.20%	rec_r34_vd_none_bilstm_ctc	下载链接
CRNN	MobileNetV3	79.37%	rec_mv3_none_bilstm_ctc	下载链接
STAR-Net	Resnet34_vd	83.93%	rec_r34_vd_tps_bilstm_ctc	下载链接
STAR-Net	MobileNetV3	81.56%	rec_mv3_tps_bilstm_ctc	下载链接
RARE	Resnet34_vd	84.90%	rec_r34_vd_tps_bilstm_attn	下载链接
RARE	MobileNetV3	83.32%	rec_mv3_tps_bilstm_attn	下载链接
SRN	Resnet50_vd_fpn	88.33%	rec_r50fpn_vd_none_srn	下载链接

说明： SRN模型使用了数据扰动方法对上述提到对两个训练集进行增广，增广后的数据可以在百度网盘上下载，提取码: y3ry。原始论文使用两阶段训练平均精度为89.74%，PaddleOCR中使用one-stage训练，平均精度为88.33%。两种预训练权重均在下载链接中。

使用LSVT街景数据集根据真值将图crop出来30w数据，进行位置校准。此外基于LSVT语料生成500w合成数据训练中文模型，相关配置和预训练文件如下：

模型	骨干网络	配置文件	预训练模型
超轻量中文模型	MobileNetV3	rec_chinese_lite_train.yml	下载链接
通用中文OCR模型	Resnet34_vd	rec_chinese_common_train.yml	下载链接

PaddleOCR文本识别算法的训练和使用请参考文档教程中模型训练/评估中的文本识别部分。