diff --git a/doc/doc_ch/FAQ.md b/doc/doc_ch/FAQ.md index 346d4c2b..d95d4cbf 100644 --- a/doc/doc_ch/FAQ.md +++ b/doc/doc_ch/FAQ.md @@ -10,7 +10,7 @@ ## PaddleOCR常见问题汇总(持续更新) * [【精选】OCR精选10个问题](#【精选】OCR精选10个问题) -* [【理论篇】OCR通用21个问题](#【理论篇】OCR通用问题) +* [【理论篇】OCR通用21个问题](#【理论篇】OCR通用问题) * [基础知识3题](#基础知识) * [数据集4题](#数据集) * [模型训练调优6题](#模型训练调优) @@ -60,24 +60,19 @@ (1)检测阶段:先按照检测框和标注框的IOU评估,IOU大于某个阈值判断为检测准确。这里检测框和标注框不同于一般的通用目标检测框,是采用多边形进行表示。 -检测准确率det_precision:正确的检测框个数在全部检测框的占比,主要是判断检测指标. +检测准确率:正确的检测框个数在全部检测框的占比,主要是判断检测指标. -检测召回率det_recall:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。 +检测召回率:正确的检测框个数在全部标注框的占比,主要是判断漏检的指标。 -检测 F1-Score: -$$ F1\_Score= \frac{2 \times det\_precision \times det\_recall}{det\_precision+det\_recall}$$ (2)识别阶段: -字符识别准确率rec_precision,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。 +字符识别准确率,即正确识别的文本行占标注的文本行数量的比例,只有整行文本识别对才算正确识别。 (3)端到端统计: -端对端准确率e2e_precision:准确检测并正确识别文本行在全部标注文本行的占比; -端到端召回率e2e_recall:准确检测并正确识别文本行在 检测到的文本行数量 的占比;准确检测的标准是检测框与标注框的IOU大于某个阈值,正确识别的的检测框中的文本与标注的文本相同。 +端对端准确率:准确检测并正确识别文本行在全部标注文本行的占比; +端到端召回率:准确检测并正确识别文本行在 检测到的文本行数量 的占比;准确检测的标准是检测框与标注框的IOU大于某个阈值,正确识别的的检测框中的文本与标注的文本相同。 -端到端 F1-Score: -$$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e2e\_recall}$$ - #### Q1.1.7:单张图上多语种并存识别(如单张图印刷体和手写文字并存),应该如何处理? **A**:单张图像中存在多种类型文本的情况很常见,典型的以学生的试卷为代表,一张图像同时存在手写体和印刷体两种文本,这类情况下,可以尝试”1个检测模型+1个N分类模型+N个识别模型”的解决方案。 @@ -91,8 +86,8 @@ $$ F1\_Score= \frac{2 \times e2e\_precision \times e2e\_recall}{e2e\_precision+e 识别的话,520W左右的数据集(真实数据26W+合成数据500W)训练,超轻量模型:4卡V100,总共训练了5天左右。通用模型:4卡V100,共训练6天。 超轻量模型训练分为2个阶段: -<1>全量数据训练50epoch,耗时3天 -<2>合成数据+真实数据按照1:1数据采样,进行finetune训练200epoch,耗时2天 +(1)全量数据训练50epoch,耗时3天 +(2)合成数据+真实数据按照1:1数据采样,进行finetune训练200epoch,耗时2天 通用模型训练: 真实数据+合成数据,动态采样(1:1)训练,200epoch,耗时 6天左右。 @@ -448,7 +443,7 @@ ocr_system: 检测识别串联预测 **A**:第一张图需要初始化,耗时较多。完成模型加载后,之后的预测时间很短。 -#### Q3.4.70:请问opt工具可以直接转int8量化后的模型为.nb文件吗 +#### Q3.4.7:请问opt工具可以直接转int8量化后的模型为.nb文件吗 **A**:有的,PaddleLite提供完善的opt工具,可以参考[文档](https://paddle-lite.readthedocs.io/zh/latest/user_guides/post_quant_with_data.html) @@ -460,7 +455,7 @@ ocr_system: 检测识别串联预测 **A**:目前不支持转ONNX -#### Q3.4.1:使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr +#### Q3.4.10:使用opt工具对检测模型转换时报错 can not found op arguments for node conv2_b_attr **A**:这个问题大概率是编译opt工具的Paddle-Lite不是develop分支,建议使用Paddle-Lite 的develop分支编译opt工具。 @@ -476,5 +471,5 @@ ocr_system: 检测识别串联预测 **A**:训练的时候标注是整个文本行的标注,所以预测的也是文本行位置,如果要获取单字符位置信息,可以根据预测的文本,计算字符数量,再去根据整个文本行的位置信息,估计文本块中每个字符的位置。 -#### Q3.4.16: +#### Q3.4.16:PaddleOCR模型部署方式有哪几种? **A**:目前有Inference部署,serving部署和手机端Paddle Lite部署,可根据不同场景做灵活的选择:Inference部署适用于本地离线部署,serving部署适用于云端部署,Paddle Lite部署适用于手机端集成。