add 5 FAQ

2021-01-11 01:11:37 +08:00 · 2021-01-11 01:11:37 +08:00 · ce12c66f3d
parent 9ded14faad
commit ce12c66f3d
2 changed files with 48 additions and 25 deletions
--- a/README_ch.md
+++ b/README_ch.md
@ -8,7 +8,7 @@ PaddleOCR同时支持动态图与静态图两种编程范式
 - 静态图版本：develop分支

 **近期更新**
- 2021.1.4 [FAQ](./doc/doc_ch/FAQ.md)新增5个高频问题，总数142个，每周一都会更新，欢迎大家持续关注。
+- 2021.1.11 [FAQ](./doc/doc_ch/FAQ.md)新增5个高频问题，总数147个，每周一都会更新，欢迎大家持续关注。
 - 2020.12.15 更新数据合成工具[Style-Text](./StyleText/README_ch.md)，可以批量合成大量与目标场景类似的图像，在多个场景验证，效果明显提升。
 - 2020.11.25 更新半自动标注工具[PPOCRLabel](./PPOCRLabel/README_ch.md)，辅助开发者高效完成标注任务，输出格式与PP-OCR训练任务完美衔接。
 - 2020.9.22 更新PP-OCR技术文章，https://arxiv.org/abs/2009.09941
@ -102,7 +102,7 @@ PaddleOCR同时支持动态图与静态图两种编程范式
 - FAQ
    - [【精选】OCR精选10个问题](./doc/doc_ch/FAQ.md)
    - [【理论篇】OCR通用31个问题](./doc/doc_ch/FAQ.md)
-    - [【实战篇】PaddleOCR实战101个问题](./doc/doc_ch/FAQ.md)
+    - [【实战篇】PaddleOCR实战106个问题](./doc/doc_ch/FAQ.md)
 - [技术交流群](#欢迎加入PaddleOCR技术交流群)
 - [参考文献](./doc/doc_ch/reference.md)
 - [许可证书](#许可证书)
--- a/doc/doc_ch/FAQ.md
+++ b/doc/doc_ch/FAQ.md
@ -15,43 +15,41 @@
  * [基础知识7题](#基础知识)
  * [数据集7题](#数据集2)
  * [模型训练调优17题](#模型训练调优2)
-* [【实战篇】PaddleOCR实战101个问题](#PaddleOCR实战问题)
-  * [使用咨询31题](#使用咨询)
+* [【实战篇】PaddleOCR实战106个问题](#PaddleOCR实战问题)
+  * [使用咨询36题](#使用咨询)
  * [数据集17题](#数据集3)
  * [模型训练调优26题](#模型训练调优3)
  * [预测部署27题](#预测部署3)


 <a name="近期更新"></a>
-## 近期更新（2021.1.4）
+## 近期更新（2021.1.11）

-#### Q3.1.29: PPOCRLabel创建矩形框时只能拖出正方形，如何进行矩形标注？

-**A**： 取消勾选：“编辑”-“正方形标注”
+#### Q3.1.32 能否修改StyleText配置文件中的分辨率？

-#### Q3.1.30: Style-Text 如何不文字风格迁移，就像普通文本生成程序一样默认字体直接输出到分割的背景图？
+**A** StyleText目前的训练数据主要是高度32的图片，建议不要改变高度。未来我们会支持更丰富的分辨率。

-**A**： 使用image_synth模式会输出fake_bg.jpg，即为背景图。如果想要批量提取背景，可以稍微修改一下代码，将fake_bg保存下来即可。要修改的位置：
-https://github.com/PaddlePaddle/PaddleOCR/blob/de3e2e7cd3b8b65ee02d7a41e570fa5b511a3c1d/StyleText/engine/synthesisers.py#L68
+#### Q3.1.33 StyleText是否可以更换字体文件？

-#### Q3.1.31: 怎么输出网络结构以及每层的参数信息？
+**A** StyleText项目中的字体文件为标准字体，主要用作模型的输入部分，不能够修改。
+StyleText的用途主要是：提取style_image中的字体、背景等style信息，根据语料生成同样style的图片。

-**A**： 可以使用 `paddle.summary`， 具体参考:https://www.paddlepaddle.org.cn/documentation/docs/zh/2.0-rc1/api/paddle/hapi/model_summary/summary_cn.html#summary。
+#### Q3.1.34 StyleText批量生成图片为什么没有输出？

-#### Q3.4.26: 目前paddle hub serving 只支持 imgpath，如果我想用imgurl 去哪里改呢？
+**A** 需要检查以下您配置文件中的路径是否都存在。尤其要注意的是[label_file配置](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/StyleText/README_ch.md#%E5%BF%AB%E9%80%9F%E4%B8%8A%E6%89%8B)。
+如果您使用的style_image输入没有label信息，您依然需要提供一个图片文件列表。

-**A**： 图片是在这里读取的：https://github.com/PaddlePaddle/PaddleOCR/blob/67ef25d593c4eabfaaceb22daade4577f53bed81/deploy/hubserving/ocr_system/module.py#L55，
-可以参考下面的写法，将url path转化为np array（https://cloud.tencent.com/developer/article/1467840）
-```
-response = request.urlopen('http://i1.whymtj.com/uploads/tu/201902/9999/52491ae4ba.jpg')
-img_array = np.array(bytearray(response.read()), dtype=np.uint8)
-img = cv.imdecode(img_array, -1)
-```
+#### Q3.1.35 怎样把OCR输出的结果组成有意义的语句呢？

-#### Q3.4.27: C++ 端侧部署可以只对OCR的检测部署吗？
+**A** OCR输出的结果包含坐标信息和文字内容两部分。如果您不关心文字的顺序，那么可以直接按box的序号连起来。
+如果需要将文字按照一定的顺序排列，则需要您设定一些规则，对文字的坐标进行处理，例如按照坐标从上到下，从左到右连接识别结果。
+对于一些有规律的垂类场景，可以设定模板，根据位置、内容进行匹配。
+例如识别身份证照片，可以先匹配"姓名"，"性别"等关键字，根据这些关键字的坐标去推测其他信息的位置，再与识别的结果匹配。

-**A**： 可以的，识别和检测模块是解耦的。如果想对检测部署，需要自己修改一下main函数，
-只保留检测相关就可以:https://github.com/PaddlePaddle/PaddleOCR/blob/de3e2e7cd3b8b65ee02d7a41e570fa5b511a3c1d/deploy/cpp_infer/src/main.cpp#L72
+#### Q3.1.36 如何识别竹简上的古文？
+**A** 对于字符都是普通的汉字字符的情况，只要标注足够的数据，finetune模型就可以了。如果数据量不足，您可以尝试StyleText工具。
+而如果使用的字符是特殊的古文字、甲骨文、象形文字等，那么首先需要构建一个古文字的字典，之后再进行训练。


 <a name="OCR精选10个问题"></a>
@ -458,6 +456,31 @@ https://github.com/PaddlePaddle/PaddleOCR/blob/de3e2e7cd3b8b65ee02d7a41e570fa5b5

 **A** 可以使用 `paddle.summary`， 具体参考:https://www.paddlepaddle.org.cn/documentation/docs/zh/2.0-rc1/api/paddle/hapi/model_summary/summary_cn.html#summary。

+#### Q3.1.32 能否修改StyleText配置文件中的分辨率？
+
+**A** StyleText目前的训练数据主要是高度32的图片，建议不要改变高度。未来我们会支持更丰富的分辨率。
+
+#### Q3.1.33 StyleText是否可以更换字体文件？
+
+**A** StyleText项目中的字体文件为标准字体，主要用作模型的输入部分，不能够修改。
+StyleText的用途主要是：提取style_image中的字体、背景等style信息，根据语料生成同样style的图片。
+
+#### Q3.1.34 StyleText批量生成图片为什么没有输出？
+
+**A** 需要检查以下您配置文件中的路径是否都存在。尤其要注意的是[label_file配置](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/StyleText/README_ch.md#%E5%BF%AB%E9%80%9F%E4%B8%8A%E6%89%8B)。
+如果您使用的style_image输入没有label信息，您依然需要提供一个图片文件列表。
+
+#### Q3.1.35 怎样把OCR输出的结果组成有意义的语句呢？
+
+**A** OCR输出的结果包含坐标信息和文字内容两部分。如果您不关心文字的顺序，那么可以直接按box的序号连起来。
+如果需要将文字按照一定的顺序排列，则需要您设定一些规则，对文字的坐标进行处理，例如按照坐标从上到下，从左到右连接识别结果。
+对于一些有规律的垂类场景，可以设定模板，根据位置、内容进行匹配。
+例如识别身份证照片，可以先匹配"姓名"，"性别"等关键字，根据这些关键字的坐标去推测其他信息的位置，再与识别的结果匹配。
+
+#### Q3.1.36 如何识别竹简上的古文？
+**A** 对于字符都是普通的汉字字符的情况，只要标注足够的数据，finetune模型就可以了。如果数据量不足，您可以尝试StyleText工具。
+而如果使用的字符是特殊的古文字、甲骨文、象形文字等，那么首先需要构建一个古文字的字典，之后再进行训练。
+
 <a name="数据集3"></a>
 ### 数据集

@ -519,8 +542,8 @@ https://github.com/PaddlePaddle/PaddleOCR/blob/de3e2e7cd3b8b65ee02d7a41e570fa5b5

 #### Q3.2.11：有哪些标注工具可以标注OCR数据集？

-**A**：您可以参考：https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_en/data_annotation_en.md。
-我们计划推出高效标注OCR数据的标注工具，请您持续关注PaddleOCR的近期更新。
+**A**：推荐您使用PPOCRLabel工具。
+您还可以参考：https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_en/data_annotation_en.md。

 #### Q3.2.12：一些特殊场景的数据识别效果差，但是数据量很少，不够用来finetune怎么办？