Update README_ch.md
This commit is contained in:
parent
b1bff7aefb
commit
57e6edd97c
|
@ -4,7 +4,7 @@
|
|||
- [一、工具简介](#工具简介)
|
||||
- [二、环境配置](#环境配置)
|
||||
- [三、快速上手](#快速上手)
|
||||
- [四、应用示例](#应用示例)
|
||||
- [四、应用案例](#应用案例)
|
||||
|
||||
<a name="工具简介"></a>
|
||||
### 一、工具简介
|
||||
|
@ -111,23 +111,23 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
|
|||
python3 -m tools.synth_dataset -t 1 -c configs/dataset_config.yml
|
||||
```
|
||||
|
||||
<a name="应用示例"></a>
|
||||
### 四、应用示例
|
||||
<a name="应用案例"></a>
|
||||
### 四、应用案例
|
||||
下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用StyleText合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例:
|
||||
|
||||
在完成上述操作后,即可得到用于OCR识别的合成数据集。在实用场景中,我们经常遇到数据量不足的情况,这时可以使用已有数据作为style_input,合成数据。
|
||||
下面给出了一些数据集生成的示例:
|
||||
<div align="center">
|
||||
<img src="doc/images/6.png" width="800">
|
||||
</div>
|
||||
|
||||
在添加这些合成数据进行训练后,识别模型的效果得到了显著提升,如下表所示:
|
||||
在添加上述合成数据进行训练后,识别模型的效果提升,如下表所示:
|
||||
|
||||
| 场景 | 字符 | 原始数据 | 测试数据 | 只使用原始数据</br>识别准确率 | 新增合成数据 | 同时使用合成数据</br>识别准确率 | 指标提升 |
|
||||
| -------- | ---------- | -------- | -------- | -------------------------- | ------------ | ---------------------- | -------- |
|
||||
| 金属表面 | 英文和数字 | 2203 | 650 | 0.5938 | 20000 | 0.7546 | 16% |
|
||||
| 随机背景 | 韩语 | 5631 | 1230 | 0.3012 | 100000 | 0.5057 | 20% |
|
||||
|
||||
识别模型的训练方法您可以参考[OCR识别文档](../doc/doc_ch/recognition.md)
|
||||
识别模型的训练方法可以参考[OCR识别文档](../doc/doc_ch/recognition.md)
|
||||
|
||||
### 项目结构
|
||||
```
|
||||
style_text_rec
|
||||
|
|
Loading…
Reference in New Issue