PaddleOCR/README.md at 24dfd8b2b2d688cfe6b44c9e4893a34a4840109a - PaddleOCR - 军科开源项目托管

9.3 KiB

Raw Blame History

English | 简体中文

简介

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力使用者训练出更好的模型，并应用落地。

近期更新

2020.9.17 更新超轻量ppocr_mobile系列和通用ppocr_server系列中英文ocr模型，媲美商业效果。模型下载
2020.8.26 更新OCR相关的84个常见问题及解答，具体参考FAQ
2020.8.24 支持通过whl包安装使用PaddleOCR，具体参考Paddleocr Package使用说明
2020.8.21 更新8月18日B站直播课回放和PPT，课节2，易学易用的OCR工具大礼包，获取地址
2020.8.16 开源文本检测算法SAST和文本识别算法SRN
2020.7.23 发布7月21日B站直播课回放和PPT，课节1，PaddleOCR开源大礼包全面解读，获取地址
2020.7.15 添加基于EasyEdge和Paddle-Lite的移动端DEMO，支持iOS和Android系统
more

特性

PPOCR系列高质量预训练模型，媲美商业效果
- 超轻量ppocr_mobile系列：检测（2.5M）+方向分类器（0.9M ）+ 识别（4.5M）= 7.9M
- 通用ppocr_server系列：检测（47.2M）+方向分类器（0.9M）+ 识别（107M）= 155.1M
- 超轻量压缩ppocr_mobile_slim系列：(coming soon)
支持中英文数字组合识别、竖排文本识别、长文本识别
支持多语言识别：韩语、日语、德语、法语 (coming soon)
支持用户自定义训练，提供丰富的预测推理部署方案
支持PIP快速安装使用
可运行于Linux、Windows、MacOS等多种系统

效果展示

上图是通用ppocr_server模型效果展示，更多效果图请见效果展示页面。

快速体验

PC端：超轻量级中文OCR在线体验地址：https://www.paddlepaddle.org.cn/hub/scene/ocr
移动端：安装包DEMO下载地址(基于EasyEdge和Paddle-Lite, 支持iOS和Android系统)，Android手机也可以直接扫描下面二维码安装体验。

代码体验：可以直接进入快速安装

PP-OCR 1.1系列模型列表（9月17日更新）

模型简介	模型名称	推荐场景	检测模型	方向分类器	识别模型
中英文超轻量OCR模型（7.9M）	ch_ppocr_mobile_v1.1_xx	移动端&服务器端	预测模型 / 预训练模型	预测模型 / 预训练模型	预测模型 / 预训练模型
中英文通用OCR模型（155.1M）	ch_ppocr_server_v1.1_xx	服务器端	预测模型 / 预训练模型	预测模型 / 预训练模型	预测模型 / 预训练模型
中英文超轻量压缩OCR模型	ch_ppocr_mobile_slim_v1.1_xx	移动端	即将开源	即将开源	即将开源

更多V1.1版本模型下载，可以参考OCR1.1模型列表

PP-OCR 1.0系列模型列表（7月16日更新）

模型简介	模型名称	检测模型	识别模型	支持空格的识别模型
超轻量中英文OCR模型（8.6M）	chinese_db_crnn_mobile_xx	inference模型 / 预训练模型	inference模型 / 预训练模型	inference模型 / 预训练模型
通用中文OCR模型（212M）	chinese_db_crnn_server_xx	inference模型 / 预训练模型	inference模型 / 预训练模型	inference模型 / 预训练模型

文档教程

快速安装
中文OCR模型快速使用
算法介绍
- 文本检测
- 文本识别
- PP-OCR (coming soon)
模型训练/评估
预测部署
- 基于Python预测引擎推理
- 基于C++预测引擎推理
- 服务化部署
- 端侧部署
- 模型量化压缩（coming soon）
- Benchmark
数据集
效果展示
FAQ
技术交流群
参考文献
许可证书
贡献代码

效果展示 more

欢迎加入PaddleOCR技术交流群

请扫描下面二维码，完成问卷填写，获取加群二维码和OCR方向的炼丹秘籍

许可证书

本项目的发布受Apache 2.0 license许可认证。

贡献代码

我们非常欢迎你为PaddleOCR贡献代码，也十分感谢你的反馈。

非常感谢 Khanh Tran 和 Karl Horky 贡献修改英文文档
非常感谢 zhangxin(Blog) 贡献新的可视化方式、添加.gitgnore、处理手动设置PYTHONPATH环境变量的问题
非常感谢 lyl120117 贡献打印网络结构的代码
非常感谢 xiangyubo 贡献手写中文OCR数据集
非常感谢 authorfu 贡献Android和xiadeye 贡献IOS的demo代码
非常感谢 BeyondYourself 给PaddleOCR提了很多非常棒的建议，并简化了PaddleOCR的部分代码风格。
非常感谢 tangmq 给PaddleOCR增加Docker化部署服务，支持快速发布可调用的Restful API服务。