PaddleOCR/doc/doc_ch/benchmark.md

2.8 KiB
Raw Blame History

Benchmark

本文给出了中英文OCR系列模型精度指标和在各平台预测耗时的benchmark。

测试数据

针对OCR实际应用场景包括合同车牌铭牌火车票化验单表格证书街景文字名片数码显示屏等收集的300张图像每张图平均有17个文本框下图给出了一些图像示例。

评估指标

说明:

  • v1.0是未添加优化策略的DB+CRNN模型v1.1是添加多种优化策略和方向分类器的PP-OCR模型。slim_v1.1是使用裁剪或量化的模型。
  • 检测输入图像的的长边尺寸是960。
  • 评估耗时阶段为图像输入到结果输出的完整阶段,包括了图像的预处理和后处理。
  • Intel至强6148为服务器端CPU型号测试中使用Intel MKL-DNN 加速。
  • 骁龙855为移动端处理平台型号。

不同预测模型大小和整体识别精度对比

模型名称 整体模型
大小M
检测模型
大小M
方向分类器
模型大小M
识别模型
大小M
整体识别
F-score
ch_ppocr_mobile_v1.1 8.1 2.6 0.9 4.6 0.5193
ch_ppocr_server_v1.1 155.1 47.2 0.9 107 0.5414
ch_ppocr_mobile_v1.0 8.6 4.1 - 4.5 0.393
ch_ppocr_server_v1.0 203.8 98.5 - 105.3 0.4436

不同预测模型在T4 GPU上预测速度对比单位ms

模型名称 整体 检测 方向分类器 识别
ch_ppocr_mobile_v1.1 137 35 24 78
ch_ppocr_server_v1.1 204 39 25 140
ch_ppocr_mobile_v1.0 117 41 - 76
ch_ppocr_server_v1.0 199 52 - 147

不同预测模型在CPU上预测速度对比单位ms

模型名称 整体 检测 方向分类器 识别
ch_ppocr_mobile_v1.1 421 164 51 206
ch_ppocr_mobile_v1.0 398 219 - 179

裁剪量化模型和原始模型模型大小整体识别精度和在SD 855上预测速度对比

模型名称 整体模型
大小M
检测模型
大小M
方向分类器
模型大小M
识别模型
大小M
整体识别
F-score
SD 855
ms
ch_ppocr_mobile_v1.1 8.1 2.6 0.9 4.6 0.5193 306
ch_ppocr_mobile_slim_v1.1 3.5 1.4 0.5 1.6 0.521 268