Merge pull request #1463 from MissPenguin/dygraph

update faq
This commit is contained in:
MissPenguin 2020-12-16 15:04:42 +08:00 committed by GitHub
commit 2a15989f19
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
2 changed files with 38 additions and 20 deletions

2
README_ch.md Normal file → Executable file
View File

@ -9,7 +9,7 @@ PaddleOCR同时支持动态图与静态图两种编程范式
**近期更新** **近期更新**
- 2020.12.15 更新数据合成工具[Style-Text](./StyleText/README_ch.md),可以批量合成大量与目标场景类似的图像,在多个场景验证,效果明显提升。 - 2020.12.15 更新数据合成工具[Style-Text](./StyleText/README_ch.md),可以批量合成大量与目标场景类似的图像,在多个场景验证,效果明显提升。
- 2020.12.07 [FAQ](./doc/doc_ch/FAQ.md)新增5个高频问题总数124个并且计划以后每周一都会更新,欢迎大家持续关注。 - 2020.12.14 [FAQ](./doc/doc_ch/FAQ.md)新增5个高频问题总数127个每周一都会更新,欢迎大家持续关注。
- 2020.11.25 更新半自动标注工具[PPOCRLabel](./PPOCRLabel/README_ch.md)辅助开发者高效完成标注任务输出格式与PP-OCR训练任务完美衔接。 - 2020.11.25 更新半自动标注工具[PPOCRLabel](./PPOCRLabel/README_ch.md)辅助开发者高效完成标注任务输出格式与PP-OCR训练任务完美衔接。
- 2020.9.22 更新PP-OCR技术文章https://arxiv.org/abs/2009.09941 - 2020.9.22 更新PP-OCR技术文章https://arxiv.org/abs/2009.09941
- [More](./doc/doc_ch/update.md) - [More](./doc/doc_ch/update.md)

54
doc/doc_ch/FAQ.md Normal file → Executable file
View File

@ -9,44 +9,42 @@
## PaddleOCR常见问题汇总(持续更新) ## PaddleOCR常见问题汇总(持续更新)
* [近期更新2020.12.07](#近期更新) * [近期更新2020.12.14](#近期更新)
* [【精选】OCR精选10个问题](#OCR精选10个问题) * [【精选】OCR精选10个问题](#OCR精选10个问题)
* [【理论篇】OCR通用30个问题](#OCR通用问题) * [【理论篇】OCR通用30个问题](#OCR通用问题)
* [基础知识7题](#基础知识) * [基础知识7题](#基础知识)
* [数据集7题](#数据集2) * [数据集7题](#数据集2)
* [模型训练调优7题](#模型训练调优2) * [模型训练调优7题](#模型训练调优2)
* [预测部署9题](#预测部署2) * [预测部署9题](#预测部署2)
* [【实战篇】PaddleOCR实战84个问题](#PaddleOCR实战问题) * [【实战篇】PaddleOCR实战87个问题](#PaddleOCR实战问题)
* [使用咨询20题](#使用咨询) * [使用咨询21题](#使用咨询)
* [数据集17题](#数据集3) * [数据集17题](#数据集3)
* [模型训练调优24题](#模型训练调优3) * [模型训练调优25题](#模型训练调优3)
* [预测部署23题](#预测部署3) * [预测部署24题](#预测部署3)
<a name="近期更新"></a> <a name="近期更新"></a>
## 近期更新2020.12.07 ## 近期更新2020.12.14
#### Q2.4.9弯曲文本有试过opencv的TPS进行弯曲校正吗? #### Q3.1.21PaddleOCR支持动态图吗?
**A**opencv的tps需要标出上下边界对应的点这些点很难通过传统方法或者深度学习方法获取。PaddleOCR里StarNet网络中的tps模块实现了自动学点自动校正可以直接尝试这个 **A**动态图版本正在紧锣密鼓开发中将于2020年12月16日发布敬请关注
#### Q3.3.20: 文字检测时怎么模糊的数据增强? #### Q3.3.23检测模型训练或预测时出现elementwise_add报错
**A**: 模糊的数据增强需要修改代码进行添加以DB为例参考[Normalize](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/ppocr/data/imaug/operators.py#L60) ,添加模糊的增强就行 **A**设置的输入尺寸必须是32的倍数否则在网络多次下采样和上采样后feature map会产生1个像素的diff从而导致elementwise_add时报shape不匹配的错误。
#### Q3.3.21: 文字检测时怎么更改图片旋转的角度实现360度任意旋转 #### Q3.3.24: DB检测训练输入尺寸640可以改大一些吗
**A**: 将[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/ppocr/data/imaug/iaa_augment.py#L64) 的(-10,10) 改为(-180,180)即可 **A**: 不建议改大。检测模型训练输入尺寸是预处理中random crop后的尺寸并非直接将原图进行resize多数场景下这个尺寸并不小了改大后可能反而并不合适而且训练会变慢。另外代码里可能有的地方参数按照预设输入尺寸适配的改大后可能有隐藏风险。
#### Q3.3.22: 训练数据的长宽比过大怎么修改shape #### Q3.3.25: 识别模型训练时loss能正常下降但acc一直为0
**A**: 识别修改[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/rec/ch_ppocr_v2.0/rec_chinese_lite_train_v2.0.yaml#L75) , **A**: 识别模型训练初期acc为0是正常的多训一段时间指标就上来了。
检测修改[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml#L85)
#### Q3.4.24DB模型能正确推理预测但换成EAST或SAST模型时报错或结果不正确
#### Q3.4.23安装paddleocr后提示没有paddle **A**使用EAST或SAST模型进行推理预测时需要在命令中指定参数--det_algorithm="EAST" 或 --det_algorithm="SAST"使用DB时不用指定是因为该参数默认值是"DB"https://github.com/PaddlePaddle/PaddleOCR/blob/e7a708e9fdaf413ed7a14da8e4a7b4ac0b211e42/tools/infer/utility.py#L43
**A**这是因为paddlepaddle gpu版本和cpu版本的名称不一致现在已经在[whl的文档](./whl.md)里做了安装说明。
<a name="OCR精选10个问题"></a> <a name="OCR精选10个问题"></a>
## 【精选】OCR精选10个问题 ## 【精选】OCR精选10个问题
@ -390,6 +388,10 @@
**A**PaddleOCR主要聚焦通用ocr如果有垂类需求您可以用PaddleOCR+垂类数据自己训练; **A**PaddleOCR主要聚焦通用ocr如果有垂类需求您可以用PaddleOCR+垂类数据自己训练;
如果缺少带标注的数据或者不想投入研发成本建议直接调用开放的API开放的API覆盖了目前比较常见的一些垂类。 如果缺少带标注的数据或者不想投入研发成本建议直接调用开放的API开放的API覆盖了目前比较常见的一些垂类。
#### Q3.1.21PaddleOCR支持动态图吗
**A**动态图版本正在紧锣密鼓开发中将于2020年12月16日发布敬请关注。
<a name="数据集3"></a> <a name="数据集3"></a>
### 数据集 ### 数据集
@ -603,6 +605,18 @@ ps -axu | grep train.py | awk '{print $2}' | xargs kill -9
**A**: 识别修改[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/rec/ch_ppocr_v2.0/rec_chinese_lite_train_v2.0.yaml#L75) , **A**: 识别修改[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/rec/ch_ppocr_v2.0/rec_chinese_lite_train_v2.0.yaml#L75) ,
检测修改[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml#L85) 检测修改[这里](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml#L85)
#### Q3.3.23检测模型训练或预测时出现elementwise_add报错
**A**设置的输入尺寸必须是32的倍数否则在网络多次下采样和上采样后feature map会产生1个像素的diff从而导致elementwise_add时报shape不匹配的错误。
#### Q3.3.24: DB检测训练输入尺寸640可以改大一些吗
**A**: 不建议改大。检测模型训练输入尺寸是预处理中random crop后的尺寸并非直接将原图进行resize多数场景下这个尺寸并不小了改大后可能反而并不合适而且训练会变慢。另外代码里可能有的地方参数按照预设输入尺寸适配的改大后可能有隐藏风险。
#### Q3.3.25: 识别模型训练时loss能正常下降但acc一直为0
**A**: 识别模型训练初期acc为0是正常的多训一段时间指标就上来了。
<a name="预测部署3"></a> <a name="预测部署3"></a>
### 预测部署 ### 预测部署
@ -711,3 +725,7 @@ ps -axu | grep train.py | awk '{print $2}' | xargs kill -9
#### Q3.4.23安装paddleocr后提示没有paddle #### Q3.4.23安装paddleocr后提示没有paddle
**A**这是因为paddlepaddle gpu版本和cpu版本的名称不一致现在已经在[whl的文档](./whl.md)里做了安装说明。 **A**这是因为paddlepaddle gpu版本和cpu版本的名称不一致现在已经在[whl的文档](./whl.md)里做了安装说明。
#### Q3.4.24DB模型能正确推理预测但换成EAST或SAST模型时报错或结果不正确
**A**使用EAST或SAST模型进行推理预测时需要在命令中指定参数--det_algorithm="EAST" 或 --det_algorithm="SAST"使用DB时不用指定是因为该参数默认值是"DB"https://github.com/PaddlePaddle/PaddleOCR/blob/e7a708e9fdaf413ed7a14da8e4a7b4ac0b211e42/tools/infer/utility.py#L43