PaddleOCR/doc/doc_ch/benchmark.md

1.6 KiB
Raw Permalink Blame History

Benchmark

本文给出了中英文OCR系列模型精度指标和在各平台预测耗时的benchmark。

测试数据

针对OCR实际应用场景包括合同车牌铭牌火车票化验单表格证书街景文字名片数码显示屏等收集的300张图像每张图平均有17个文本框下图给出了一些图像示例。

评估指标

说明:

  • 检测输入图像的的长边尺寸是960。
  • 评估耗时阶段为图像预测耗时,不包括图像的预处理和后处理。
  • Intel至强6148为服务器端CPU型号测试中使用Intel MKL-DNN 加速。
  • 骁龙855为移动端处理平台型号。

预测模型大小和整体识别精度对比

模型名称 整体模型
大小M
检测模型
大小M
方向分类器
模型大小M
识别模型
大小M
整体识别
F-score
PP-OCRv2 11.6 3.0 0.9 8.6 0.5224
PP-OCR mobile 8.1 2.6 0.9 4.6 0.503
PP-OCR server 155.1 47.2 0.9 107 0.570

预测模型在CPU和GPU上的速度对比单位ms

模型名称 CPU T4 GPU
PP-OCRv2 330 111
PP-OCR mobile 356 11 6
PP-OCR server 1056 200

更多 PP-OCR 系列模型的预测指标可以参考PP-OCR Benchmark