test=develop,update_docs
This commit is contained in:
parent
c4a3ecdcb6
commit
29ba105c91
|
@ -60,24 +60,19 @@
|
||||||
|
|
||||||
(1)检测阶段:先按照检测框和标注框的IOU评估,IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框,是采用多边形进行表示。
|
(1)检测阶段:先按照检测框和标注框的IOU评估,IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框,是采用多边形进行表示。
|
||||||
|
|
||||||
检测准确率det_precision:正确的检测框个数在全部检测框的占比,主要是判断检测指标.
|
检测准确率:正确的检测框个数在全部检测框的占比,主要是判断检测指标.
|
||||||
|
|
||||||
检测召回率det_recall:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。
|
检测召回率:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。
|
||||||
|
|
||||||
检测 F1-Score:
|
|
||||||
$$ F1\_Score= \frac{2 \times det\_precision \times det\_recall}{det\_precision+det\_recall}$$
|
|
||||||
|
|
||||||
(2)识别阶段:
|
(2)识别阶段:
|
||||||
字符识别准确率rec_precision,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。
|
字符识别准确率,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。
|
||||||
|
|
||||||
(3)端到端统计:
|
(3)端到端统计:
|
||||||
端对端准确率e2e_precision:准确检测并正确识别文本行在全部标注文本行的占比;
|
端对端准确率:准确检测并正确识别文本行在全部标注文本行的占比;
|
||||||
端到端召回率e2e_recall:准确检测并正确识别文本行在 检测到的文本行数量 的占比;准确检测的标准是检测框与标注框的IOU大于某个阈值,正确识别的的检测框中的文本与标注的文本相同。
|
端到端召回率:准确检测并正确识别文本行在 检测到的文本行数量 的占比;准确检测的标准是检测框与标注框的IOU大于某个阈值,正确识别的的检测框中的文本与标注的文本相同。
|
||||||
|
|
||||||
|
|
||||||
端到端 F1-Score:
|
|
||||||
$$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e2e\_recall}$$
|
|
||||||
|
|
||||||
#### Q1.1.7:单张图上多语种并存识别(如单张图印刷体和手写文字并存),应该如何处理?
|
#### Q1.1.7:单张图上多语种并存识别(如单张图印刷体和手写文字并存),应该如何处理?
|
||||||
|
|
||||||
**A**:单张图像中存在多种类型文本的情况很常见,典型的以学生的试卷为代表,一张图像同时存在手写体和印刷体两种文本,这类情况下,可以尝试”1个检测模型+1个N分类模型+N个识别模型”的解决方案。
|
**A**:单张图像中存在多种类型文本的情况很常见,典型的以学生的试卷为代表,一张图像同时存在手写体和印刷体两种文本,这类情况下,可以尝试”1个检测模型+1个N分类模型+N个识别模型”的解决方案。
|
||||||
|
@ -91,8 +86,8 @@ $$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e
|
||||||
识别的话,520W左右的数据集(真实数据26W+合成数据500W)训练,超轻量模型:4卡V100,总共训练了5天左右。通用模型:4卡V100,共训练6天。
|
识别的话,520W左右的数据集(真实数据26W+合成数据500W)训练,超轻量模型:4卡V100,总共训练了5天左右。通用模型:4卡V100,共训练6天。
|
||||||
|
|
||||||
超轻量模型训练分为2个阶段:
|
超轻量模型训练分为2个阶段:
|
||||||
<1>全量数据训练50epoch,耗时3天
|
(1)全量数据训练50epoch,耗时3天
|
||||||
<2>合成数据+真实数据按照1:1数据采样,进行finetune训练200epoch,耗时2天
|
(2)合成数据+真实数据按照1:1数据采样,进行finetune训练200epoch,耗时2天
|
||||||
|
|
||||||
通用模型训练:
|
通用模型训练:
|
||||||
真实数据+合成数据,动态采样(1:1)训练,200epoch,耗时 6天左右。
|
真实数据+合成数据,动态采样(1:1)训练,200epoch,耗时 6天左右。
|
||||||
|
@ -448,7 +443,7 @@ ocr_system: 检测识别串联预测
|
||||||
|
|
||||||
**A**:第一张图需要初始化,耗时较多。完成模型加载后,之后的预测时间很短。
|
**A**:第一张图需要初始化,耗时较多。完成模型加载后,之后的预测时间很短。
|
||||||
|
|
||||||
#### Q3.4.70:请问opt工具可以直接转int8量化后的模型为.nb文件吗
|
#### Q3.4.7:请问opt工具可以直接转int8量化后的模型为.nb文件吗
|
||||||
|
|
||||||
**A**:有的,PaddleLite提供完善的opt工具,可以参考[文档](https://paddle-lite.readthedocs.io/zh/latest/user_guides/post_quant_with_data.html)
|
**A**:有的,PaddleLite提供完善的opt工具,可以参考[文档](https://paddle-lite.readthedocs.io/zh/latest/user_guides/post_quant_with_data.html)
|
||||||
|
|
||||||
|
@ -460,7 +455,7 @@ ocr_system: 检测识别串联预测
|
||||||
|
|
||||||
**A**:目前不支持转ONNX
|
**A**:目前不支持转ONNX
|
||||||
|
|
||||||
#### Q3.4.1:使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr
|
#### Q3.4.10:使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr
|
||||||
|
|
||||||
**A**:这个问题大概率是编译opt工具的Paddle-Lite不是develop分支,建议使用Paddle-Lite 的develop分支编译opt工具。
|
**A**:这个问题大概率是编译opt工具的Paddle-Lite不是develop分支,建议使用Paddle-Lite 的develop分支编译opt工具。
|
||||||
|
|
||||||
|
@ -476,5 +471,5 @@ ocr_system: 检测识别串联预测
|
||||||
|
|
||||||
**A**:训练的时候标注是整个文本行的标注,所以预测的也是文本行位置,如果要获取单字符位置信息,可以根据预测的文本,计算字符数量,再去根据整个文本行的位置信息,估计文本块中每个字符的位置。
|
**A**:训练的时候标注是整个文本行的标注,所以预测的也是文本行位置,如果要获取单字符位置信息,可以根据预测的文本,计算字符数量,再去根据整个文本行的位置信息,估计文本块中每个字符的位置。
|
||||||
|
|
||||||
#### Q3.4.16:
|
#### Q3.4.16:PaddleOCR模型部署方式有哪几种?
|
||||||
**A**:目前有Inference部署,serving部署和手机端Paddle Lite部署,可根据不同场景做灵活的选择:Inference部署适用于本地离线部署,serving部署适用于云端部署,Paddle Lite部署适用于手机端集成。
|
**A**:目前有Inference部署,serving部署和手机端Paddle Lite部署,可根据不同场景做灵活的选择:Inference部署适用于本地离线部署,serving部署适用于云端部署,Paddle Lite部署适用于手机端集成。
|
||||||
|
|
Loading…
Reference in New Issue