Update README_ch.md

This commit is contained in:
dyning 2020-12-15 23:02:41 +08:00 committed by GitHub
parent b1bff7aefb
commit 57e6edd97c
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
1 changed files with 7 additions and 7 deletions

View File

@ -4,7 +4,7 @@
- [一、工具简介](#工具简介)
- [二、环境配置](#环境配置)
- [三、快速上手](#快速上手)
- [四、应用示例](#应用示例)
- [四、应用案例](#应用案例)
<a name="工具简介"></a>
### 一、工具简介
@ -111,23 +111,23 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
python3 -m tools.synth_dataset -t 1 -c configs/dataset_config.yml
```
<a name="应用示例"></a>
### 四、应用示例
<a name="应用案例"></a>
### 四、应用案例
下面以金属表面英文数字识别和通用韩语识别两个场景为例说明使用StyleText合成数据来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例
在完成上述操作后即可得到用于OCR识别的合成数据集。在实用场景中我们经常遇到数据量不足的情况这时可以使用已有数据作为style_input合成数据。
下面给出了一些数据集生成的示例:
<div align="center">
<img src="doc/images/6.png" width="800">
</div>
在添加这些合成数据进行训练后,识别模型的效果得到了显著提升,如下表所示:
在添加上述合成数据进行训练后,识别模型的效果提升,如下表所示:
| 场景 | 字符 | 原始数据 | 测试数据 | 只使用原始数据</br>识别准确率 | 新增合成数据 | 同时使用合成数据</br>识别准确率 | 指标提升 |
| -------- | ---------- | -------- | -------- | -------------------------- | ------------ | ---------------------- | -------- |
| 金属表面 | 英文和数字 | 2203 | 650 | 0.5938 | 20000 | 0.7546 | 16% |
| 随机背景 | 韩语 | 5631 | 1230 | 0.3012 | 100000 | 0.5057 | 20% |
识别模型的训练方法您可以参考[OCR识别文档](../doc/doc_ch/recognition.md)
识别模型的训练方法可以参考[OCR识别文档](../doc/doc_ch/recognition.md)
### 项目结构
```
style_text_rec