test=develop,update_docs

This commit is contained in:
grasswolfs 2020-08-26 17:17:07 +08:00
parent c4a3ecdcb6
commit 29ba105c91
1 changed files with 11 additions and 16 deletions

View File

@ -10,7 +10,7 @@
## PaddleOCR常见问题汇总(持续更新) ## PaddleOCR常见问题汇总(持续更新)
* [【精选】OCR精选10个问题](#【精选】OCR精选10个问题) * [【精选】OCR精选10个问题](#【精选】OCR精选10个问题)
* [【理论篇】OCR通用21个问题](#【理论篇】OCR通用问题) * [【理论篇】OCR通用21个问题](#【理论篇】OCR通用问题)
* [基础知识3题](#基础知识) * [基础知识3题](#基础知识)
* [数据集4题](#数据集) * [数据集4题](#数据集)
* [模型训练调优6题](#模型训练调优) * [模型训练调优6题](#模型训练调优)
@ -60,24 +60,19 @@
1检测阶段先按照检测框和标注框的IOU评估IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框是采用多边形进行表示。 1检测阶段先按照检测框和标注框的IOU评估IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框是采用多边形进行表示。
检测准确率det_precision:正确的检测框个数在全部检测框的占比,主要是判断检测指标. 检测准确率:正确的检测框个数在全部检测框的占比,主要是判断检测指标.
检测召回率det_recall:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。 检测召回率:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。
检测 F1-Score
$$ F1\_Score= \frac{2 \times det\_precision \times det\_recall}{det\_precision+det\_recall}$$
2识别阶段 2识别阶段
字符识别准确率rec_precision,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。 字符识别准确率,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。
3端到端统计 3端到端统计
端对端准确率e2e_precision:准确检测并正确识别文本行在全部标注文本行的占比; 端对端准确率:准确检测并正确识别文本行在全部标注文本行的占比;
端到端召回率e2e_recall:准确检测并正确识别文本行在 检测到的文本行数量 的占比准确检测的标准是检测框与标注框的IOU大于某个阈值正确识别的的检测框中的文本与标注的文本相同。 端到端召回率:准确检测并正确识别文本行在 检测到的文本行数量 的占比准确检测的标准是检测框与标注框的IOU大于某个阈值正确识别的的检测框中的文本与标注的文本相同。
端到端 F1-Score
$$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e2e\_recall}$$
#### Q1.1.7:单张图上多语种并存识别(如单张图印刷体和手写文字并存),应该如何处理? #### Q1.1.7:单张图上多语种并存识别(如单张图印刷体和手写文字并存),应该如何处理?
**A**单张图像中存在多种类型文本的情况很常见典型的以学生的试卷为代表一张图像同时存在手写体和印刷体两种文本这类情况下可以尝试”1个检测模型+1个N分类模型+N个识别模型”的解决方案。 **A**单张图像中存在多种类型文本的情况很常见典型的以学生的试卷为代表一张图像同时存在手写体和印刷体两种文本这类情况下可以尝试”1个检测模型+1个N分类模型+N个识别模型”的解决方案。
@ -91,8 +86,8 @@ $$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e
识别的话520W左右的数据集真实数据26W+合成数据500W训练超轻量模型4卡V100总共训练了5天左右。通用模型4卡V100共训练6天。 识别的话520W左右的数据集真实数据26W+合成数据500W训练超轻量模型4卡V100总共训练了5天左右。通用模型4卡V100共训练6天。
超轻量模型训练分为2个阶段 超轻量模型训练分为2个阶段
<1>全量数据训练50epoch耗时3天 (1)全量数据训练50epoch耗时3天
<2>合成数据+真实数据按照1:1数据采样进行finetune训练200epoch耗时2天 (2)合成数据+真实数据按照1:1数据采样进行finetune训练200epoch耗时2天
通用模型训练: 通用模型训练:
真实数据+合成数据,动态采样(11)训练200epoch耗时 6天左右。 真实数据+合成数据,动态采样(11)训练200epoch耗时 6天左右。
@ -448,7 +443,7 @@ ocr_system: 检测识别串联预测
**A**:第一张图需要初始化,耗时较多。完成模型加载后,之后的预测时间很短。 **A**:第一张图需要初始化,耗时较多。完成模型加载后,之后的预测时间很短。
#### Q3.4.70请问opt工具可以直接转int8量化后的模型为.nb文件吗 #### Q3.4.7请问opt工具可以直接转int8量化后的模型为.nb文件吗
**A**有的PaddleLite提供完善的opt工具可以参考[文档](https://paddle-lite.readthedocs.io/zh/latest/user_guides/post_quant_with_data.html) **A**有的PaddleLite提供完善的opt工具可以参考[文档](https://paddle-lite.readthedocs.io/zh/latest/user_guides/post_quant_with_data.html)
@ -460,7 +455,7 @@ ocr_system: 检测识别串联预测
**A**目前不支持转ONNX **A**目前不支持转ONNX
#### Q3.4.1使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr #### Q3.4.10使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr
**A**这个问题大概率是编译opt工具的Paddle-Lite不是develop分支建议使用Paddle-Lite 的develop分支编译opt工具。 **A**这个问题大概率是编译opt工具的Paddle-Lite不是develop分支建议使用Paddle-Lite 的develop分支编译opt工具。
@ -476,5 +471,5 @@ ocr_system: 检测识别串联预测
**A**:训练的时候标注是整个文本行的标注,所以预测的也是文本行位置,如果要获取单字符位置信息,可以根据预测的文本,计算字符数量,再去根据整个文本行的位置信息,估计文本块中每个字符的位置。 **A**:训练的时候标注是整个文本行的标注,所以预测的也是文本行位置,如果要获取单字符位置信息,可以根据预测的文本,计算字符数量,再去根据整个文本行的位置信息,估计文本块中每个字符的位置。
#### Q3.4.16 #### Q3.4.16PaddleOCR模型部署方式有哪几种
**A**目前有Inference部署serving部署和手机端Paddle Lite部署可根据不同场景做灵活的选择Inference部署适用于本地离线部署serving部署适用于云端部署Paddle Lite部署适用于手机端集成。 **A**目前有Inference部署serving部署和手机端Paddle Lite部署可根据不同场景做灵活的选择Inference部署适用于本地离线部署serving部署适用于云端部署Paddle Lite部署适用于手机端集成。