Merge pull request #1409 from MissPenguin/develop

update FAQ
2020-12-14 19:46:23 +08:00 · 2020-12-14 19:46:23 +08:00 · 300c66a174
parent e7a708e9fd fd1961a4dc
commit 300c66a174
2 changed files with 36 additions and 19 deletions
--- a/README_ch.md
+++ b/README_ch.md
@ -4,7 +4,7 @@
 PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

 **近期更新**
- 2020.12.07 [FAQ](./doc/doc_ch/FAQ.md)新增5个高频问题，总数124个，并且计划以后每周一都会更新，欢迎大家持续关注。
+- 2020.12.14 [FAQ](./doc/doc_ch/FAQ.md)新增5个高频问题，总数129个，每周一都会更新，欢迎大家持续关注。
 - 2020.11.25 更新半自动标注工具[PPOCRLabel](./PPOCRLabel/README.md)，辅助开发者高效完成标注任务，输出格式与PP-OCR训练任务完美衔接。
 - 2020.9.22 更新PP-OCR技术文章，https://arxiv.org/abs/2009.09941
 - 2020.9.19 更新超轻量压缩ppocr_mobile_slim系列模型，整体模型3.5M(详见[PP-OCR Pipeline](#PP-OCR))，适合在移动端部署使用。[模型下载](#模型下载)
--- a/doc/doc_ch/FAQ.md
+++ b/doc/doc_ch/FAQ.md
@ -9,44 +9,42 @@

 ## PaddleOCR常见问题汇总(持续更新)

-* [近期更新（2020.12.07）](#近期更新)
+* [近期更新（2020.12.14）](#近期更新)
 * [【精选】OCR精选10个问题](#OCR精选10个问题)
 * [【理论篇】OCR通用30个问题](#OCR通用问题)
  * [基础知识7题](#基础知识)
  * [数据集7题](#数据集2)
  * [模型训练调优7题](#模型训练调优2)
  * [预测部署9题](#预测部署2)
-* [【实战篇】PaddleOCR实战84个问题](#PaddleOCR实战问题)
-  * [使用咨询20题](#使用咨询)
+* [【实战篇】PaddleOCR实战89个问题](#PaddleOCR实战问题)
+  * [使用咨询21题](#使用咨询)
  * [数据集17题](#数据集3)
-  * [模型训练调优24题](#模型训练调优3)
-  * [预测部署23题](#预测部署3)
+  * [模型训练调优27题](#模型训练调优3)
+  * [预测部署24题](#预测部署3)


 <a name="近期更新"></a>
-## 近期更新（2020.12.07）
+## 近期更新（2020.12.14）

-#### Q2.4.9：弯曲文本有试过opencv的TPS进行弯曲校正吗？
+#### Q3.1.21：PaddleOCR支持动态图吗？

-**A**：opencv的tps需要标出上下边界对应的点，这些点很难通过传统方法或者深度学习方法获取。PaddleOCR里StarNet网络中的tps模块实现了自动学点，自动校正，可以直接尝试这个。
+**A**：动态图版本正在紧锣密鼓开发中，本周即将发布，敬请关注。

-#### Q3.3.22: 文字检测时怎么模糊的数据增强？
+#### Q3.3.25：检测模型训练或预测时出现elementwise_add报错

-**A**: 模糊的数据增强需要修改代码进行添加，以DB为例，在[这一行](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/det/db_process.py#L145) 之前添加模糊的增强就行 
+**A**：设置的输入尺寸必须是32的倍数，否则在网络多次下采样和上采样后，feature map会产生1个像素的diff，从而导致elementwise_add时报shape不匹配的错误。

-#### Q3.3.23: 文字检测时怎么更改图片旋转的角度，实现360度任意旋转？
+#### Q3.3.26: DB检测训练输入尺寸640，可以改大一些吗？

-**A**: 角度调整参考[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/det/data_augment.py#L22) 的(-10,10) 改为(-180,180)即可 
+**A**: 不建议改大。检测模型训练输入尺寸是预处理中random crop后的尺寸，并非直接将原图进行resize，多数场景下这个尺寸并不小了，改大后可能反而并不合适，而且训练会变慢。另外，代码里可能有的地方参数按照预设输入尺寸适配的，改大后可能有隐藏风险。

-#### Q3.3.24: 训练数据的长宽比过大怎么修改shape
+#### Q3.3.27: 识别模型训练时，loss能正常下降，但acc一直为0

-**A**: 识别数据长宽比修改参考[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/configs/rec/ch_ppocr_v1.1/rec_chinese_common_train_v1.1.yml#L12),
-识别数据长宽比修改参考[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/configs/det/det_mv3_db.yml#L13)
+**A**: 识别模型训练初期acc为0是正常的，多训一段时间指标就上来了。

+#### Q3.4.24：DB模型能正确推理预测，但换成EAST或SAST模型时报错或结果不正确

-#### Q3.4.23：安装paddleocr后，提示没有paddle
-
-**A**：这是因为paddlepaddle gpu版本和cpu版本的名称不一致，现在已经在[whl的文档](./whl.md)里做了安装说明。
+**A**：使用EAST或SAST模型进行推理预测时，需要在命令中指定参数--det_algorithm="EAST" 或 --det_algorithm="SAST"，使用DB时不用指定是因为该参数默认值是"DB"：https://github.com/PaddlePaddle/PaddleOCR/blob/e7a708e9fdaf413ed7a14da8e4a7b4ac0b211e42/tools/infer/utility.py#L43

 <a name="OCR精选10个问题"></a>
 ## 【精选】OCR精选10个问题
@ -390,6 +388,10 @@
 **A**：PaddleOCR主要聚焦通用ocr，如果有垂类需求，您可以用PaddleOCR+垂类数据自己训练；
 如果缺少带标注的数据，或者不想投入研发成本，建议直接调用开放的API，开放的API覆盖了目前比较常见的一些垂类。

+#### Q3.1.21：PaddleOCR支持动态图吗？
+
+**A**：动态图版本正在紧锣密鼓开发中，本周即将发布，敬请关注。
+
 <a name="数据集3"></a>
 ### 数据集

@ -612,6 +614,17 @@ return paddle.reader.multiprocess_reader(readers, False, queue_size=320)
 **A**: 识别修改[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/configs/rec/ch_ppocr_v1.1/rec_chinese_common_train_v1.1.yml#L12) ,
 检测修改[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/configs/det/det_mv3_db.yml#L13)

+#### Q3.3.25：检测模型训练或预测时出现elementwise_add报错
+
+**A**：设置的输入尺寸必须是32的倍数，否则在网络多次下采样和上采样后，feature map会产生1个像素的diff，从而导致elementwise_add时报shape不匹配的错误。
+
+#### Q3.3.26: DB检测训练输入尺寸640，可以改大一些吗？
+
+**A**: 不建议改大。检测模型训练输入尺寸是预处理中random crop后的尺寸，并非直接将原图进行resize，多数场景下这个尺寸并不小了，改大后可能反而并不合适，而且训练会变慢。另外，代码里可能有的地方参数按照预设输入尺寸适配的，改大后可能有隐藏风险。
+
+#### Q3.3.27: 识别模型训练时，loss能正常下降，但acc一直为0
+
+**A**: 识别模型训练初期acc为0是正常的，多训一段时间指标就上来了。

 <a name="预测部署3"></a>
 ### 预测部署
@ -719,3 +732,7 @@ return paddle.reader.multiprocess_reader(readers, False, queue_size=320)
 #### Q3.4.23：安装paddleocr后，提示没有paddle

 **A**：这是因为paddlepaddle gpu版本和cpu版本的名称不一致，现在已经在[whl的文档](./whl.md)里做了安装说明。
+
+#### Q3.4.24：DB模型能正确推理预测，但换成EAST或SAST模型时报错或结果不正确
+
+**A**：使用EAST或SAST模型进行推理预测时，需要在命令中指定参数--det_algorithm="EAST" 或 --det_algorithm="SAST"，使用DB时不用指定是因为该参数默认值是"DB"：https://github.com/PaddlePaddle/PaddleOCR/blob/e7a708e9fdaf413ed7a14da8e4a7b4ac0b211e42/tools/infer/utility.py#L43