Merge pull request #317 from MissPenguin/develop

add benchmark & mobile demo qr code
This commit is contained in:
dyning 2020-07-13 23:32:04 +08:00 committed by GitHub
commit 530710cf70
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
4 changed files with 31 additions and 4 deletions

View File

@ -33,6 +33,11 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库助力
- [**中文OCR模型快速使用**](./doc/doc_ch/quickstart.md) - [**中文OCR模型快速使用**](./doc/doc_ch/quickstart.md)
- [基于EasyEdge的**移动端demo**体验](https://ai.baidu.com/easyedge/app/openSource?from=paddlelite)(点击本链接或直接扫描如下二维码)
<img src="./doc/mobile_demo_qrcode.png" width = "300" height = "160" />
## 中文OCR模型列表 ## 中文OCR模型列表
|模型名称|模型简介|检测模型地址|识别模型地址|支持空格的识别模型地址| |模型名称|模型简介|检测模型地址|识别模型地址|支持空格的识别模型地址|
@ -57,7 +62,7 @@ PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库助力
- 基于C++预测引擎推理(comming soon) - 基于C++预测引擎推理(comming soon)
- [服务化部署](./doc/doc_ch/serving.md) - [服务化部署](./doc/doc_ch/serving.md)
- [端侧部署](./deploy/lite/readme.md) - [端侧部署](./deploy/lite/readme.md)
- Benchmark - [Benchmark](./doc/doc_ch/benchmark.md)
- 数据集 - 数据集
- [通用中英文OCR数据集](./doc/doc_ch/datasets.md) - [通用中英文OCR数据集](./doc/doc_ch/datasets.md)
- 垂类多语言OCR数据集 - 垂类多语言OCR数据集
@ -126,7 +131,8 @@ PaddleOCR开源的文本识别算法列表
|RARE|Resnet34_vd|84.90%|rec_r34_vd_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_tps_bilstm_attn.tar)| |RARE|Resnet34_vd|84.90%|rec_r34_vd_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_r34_vd_tps_bilstm_attn.tar)|
|RARE|MobileNetV3|83.32%|rec_mv3_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_tps_bilstm_attn.tar)| |RARE|MobileNetV3|83.32%|rec_mv3_tps_bilstm_attn|[下载链接](https://paddleocr.bj.bcebos.com/rec_mv3_tps_bilstm_attn.tar)|
使用[LSVT](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/datasets.md#1icdar2019-lsvt)街景数据集根据真值将图crop出来30w数据进行位置校准。此外基于LSVT语料生成500w合成数据训练中文模型相关配置和预训练文件如下 使用[LSVT](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/datasets.md#1icdar2019-lsvt)街景数据集根据真值将图crop出来30w数据进行位置校准。此外基于LSVT语料生成500w合成数据训练中文模型相关配置和预训练文件如下
|模型|骨干网络|配置文件|预训练模型| |模型|骨干网络|配置文件|预训练模型|
|-|-|-|-| |-|-|-|-|
|超轻量中文模型|MobileNetV3|rec_chinese_lite_train.yml|[下载链接](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar)| |超轻量中文模型|MobileNetV3|rec_chinese_lite_train.yml|[下载链接](https://paddleocr.bj.bcebos.com/ch_models/ch_rec_mv3_crnn.tar)|

21
doc/doc_ch/benchmark.md Normal file
View File

@ -0,0 +1,21 @@
# Benchmark
本文给出了PaddleOCR超轻量中文模型8.6M在各平台的预测耗时benchmark。
## 测试数据
- 从中文公开数据集[ICDAR2017-RCTW](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/datasets.md#ICDAR2017-RCTW-17)中随机采样**500**张图像。
该集合大部分图片是通过手机摄像头在野外采集的。有些是截图。这些图片展示了各种各样的场景,包括街景、海报、菜单、室内场景和手机应用程序的截图。
## 评估指标
在四种平台上的预测耗时指标如下:
|长边尺寸(px)|T4(s)|V100(s)|Intel至强6148(s)|骁龙855(s)|
|-|-|-|-|-|
|960|0.092|0.057|0.656|0.354|
|640|0.067|0.045|0.386| 0.236|
|480|0.057|0.043|0.241| 0.175|
说明:
- 评估耗时阶段为图像输入到结果输出的完整阶段,包括了图像的预处理和后处理。
- `Intel至强6148`为服务器端CPU型号。
- `骁龙855`为移动端处理平台型号。

View File

@ -88,5 +88,5 @@ python3 tools/infer/predict_system.py --image_dir="./doc/imgs_en/img_12.jpg" --d
此外文档教程中也提供了中文OCR模型的其他预测部署方式 此外文档教程中也提供了中文OCR模型的其他预测部署方式
- 基于C++预测引擎推理(comming soon) - 基于C++预测引擎推理(comming soon)
- [服务部署](./doc/doc_ch/serving.md) - [服务部署](./serving.md)
- 端侧部署(comming soon) - [端侧部署](../../deploy/lite/readme.md)

BIN
doc/mobile_demo_qrcode.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 308 KiB