update readme

This commit is contained in:
LDOUBLEV 2020-05-12 15:35:10 +08:00
parent 561c54460c
commit e91f370362
2 changed files with 8 additions and 11 deletions

View File

@ -2,7 +2,6 @@
# 简介 # 简介
PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别模型/工具库,助力使用者训练出更好的模型,并应用落地。 PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别模型/工具库,助力使用者训练出更好的模型,并应用落地。
【这里加上效果图】
## 文档教程 ## 文档教程
- [快速安装](./doc/installation.md) - [快速安装](./doc/installation.md)
@ -11,7 +10,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别
## 特性: ## 特性:
- 超轻量级模型 - 超轻量级模型
-检测模型4.1M + 识别模型4.5M = 8.6M - (检测模型4.1M + 识别模型4.5M = 8.6M)
- 支持竖排文字 - 支持竖排文字
- (单模型同时支持横排和竖排文字识别) - (单模型同时支持横排和竖排文字识别)
- 支持长文本识别 - 支持长文本识别
@ -21,7 +20,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的文字检测、识别
## 文本检测算法: ## 文本检测算法:
PaddleOCR提供的文本检测算法列表: PaddleOCR开源的文本检测算法列表:
- [EAST](https://arxiv.org/abs/1704.03155) - [EAST](https://arxiv.org/abs/1704.03155)
- [DB](https://arxiv.org/abs/1911.08947) - [DB](https://arxiv.org/abs/1911.08947)
- [SAST](https://arxiv.org/abs/1908.05498) - [SAST](https://arxiv.org/abs/1908.05498)
@ -38,16 +37,14 @@ PaddleOCR文本检测算法的训练与使用请参考[文档](./doc/detection.m
## 文本识别算法: ## 文本识别算法:
PaddleOCR提供的文本识别算法列表: PaddleOCR开源的文本识别算法列表:
- (CRNN)[https://arxiv.org/abs/1507.05717] - (CRNN)[https://arxiv.org/abs/1507.05717]
- [Rosetta](https://arxiv.org/abs/1910.05085) - [Rosetta](https://arxiv.org/abs/1910.05085)
- [STAR-Net](http://www.bmva.org/bmvc/2016/papers/paper043/index.html) - [STAR-Net](http://www.bmva.org/bmvc/2016/papers/paper043/index.html)
- [RARE](https://arxiv.org/abs/1603.03915v1) - [RARE](https://arxiv.org/abs/1603.03915v1)
- [SRN]((https://arxiv.org/abs/2003.12294))(百度自研) - [SRN]((https://arxiv.org/abs/2003.12294))(百度自研)
算法效果: 算法效果如下表所示精度指标是在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上的评测结果的平均值。
以下指标是在IIIT, SVT, IC03, IC13, IC15, SVTP, CUTE数据集上的评测结果的平均。
|模型|骨干网络|ACC| |模型|骨干网络|ACC|
|-|-|-| |-|-|-|

View File

@ -2,7 +2,7 @@
本节以icdar15数据集为例介绍PaddleOCR中检测模型的使用方式。 本节以icdar15数据集为例介绍PaddleOCR中检测模型的使用方式。
## 3.1 数据准备 ## 数据准备
icdar2015数据集可以从[官网](https://rrc.cvc.uab.es/?ch=4&com=downloads)下载到,首次下载需注册。 icdar2015数据集可以从[官网](https://rrc.cvc.uab.es/?ch=4&com=downloads)下载到,首次下载需注册。
将下载到的数据集解压到工作目录下,假设解压在/PaddleOCR/train_data/ 下。另外PaddleOCR将零散的标注文件整理成单独的标注文件 将下载到的数据集解压到工作目录下,假设解压在/PaddleOCR/train_data/ 下。另外PaddleOCR将零散的标注文件整理成单独的标注文件
@ -30,7 +30,7 @@ json.dumps编码前的图像标注信息是包含多个字典的list字典中
可以按照上述形式构建标注文件。 可以按照上述形式构建标注文件。
## 3.2 快速启动训练 ## 快速启动训练
首先下载pretrain modelPaddleOCR的检测模型目前支持两种backbone分别是MobileNetV3、ResNet50_vd 首先下载pretrain modelPaddleOCR的检测模型目前支持两种backbone分别是MobileNetV3、ResNet50_vd
您可以根据需求使用[PaddleClas](https://github.com/PaddlePaddle/PaddleClas/tree/master/ppcls/modeling/architectures)中的模型更换backbone。 您可以根据需求使用[PaddleClas](https://github.com/PaddlePaddle/PaddleClas/tree/master/ppcls/modeling/architectures)中的模型更换backbone。
@ -55,7 +55,7 @@ python3 tools/train.py -c configs/det/det_db_mv3.yml
python3 tools/train.py -c configs/det/det_db_mv3.yml -o Optimizer.base_lr=0.0001 python3 tools/train.py -c configs/det/det_db_mv3.yml -o Optimizer.base_lr=0.0001
``` ```
## 3.3 指标评估 ## 指标评估
PaddleOCR计算三个OCR检测相关的指标分别是Precision、Recall、Hmean。 PaddleOCR计算三个OCR检测相关的指标分别是Precision、Recall、Hmean。
@ -65,7 +65,7 @@ PaddleOCR计算三个OCR检测相关的指标分别是Precision、Recall
python3 tools/eval.py -c configs/det/det_db_mv3.yml -o checkpoints="./output/best_accuracy" python3 tools/eval.py -c configs/det/det_db_mv3.yml -o checkpoints="./output/best_accuracy"
``` ```
## 3.4 测试检测效果 ## 测试检测效果
测试单张图像的检测效果 测试单张图像的检测效果
``` ```