Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别

Notifications You must be signed in to change notification settings

yxandam/chinese-ocr

Repository files navigation

本文基于tensorflow、keras/pytorch实现对自然场景的文字检测及端到端的OCR中文文字识别

实现功能

  • 文字方向检测 0、90、180、270度检测
  • 文字检测 后期将切换到keras版本文本检测 实现keras端到端的文本检测及识别
  • 不定长OCR识别

环境部署

##GPU环境
sh setup.sh
##CPU环境
sh setup-cpu.sh

模型训练

训练keras版本的crnn

cd train & sh train-keras.sh 

训练pytorch版本的crnn

cd train & sh train-pytorch.sh 

文字方向检测

基于图像分类,在VGG16模型的基础上,训练0、90、180、270度检测的分类模型,详细代码参考angle/predict.py文件,训练图片8000张,准确率88.23%。 模型地址百度云下载

文字检测

支持CPU、GPU环境,一键部署, 文本检测训练参考(https://github.com/eragonruan/text-detection-ctpn)

OCR 端到端识别:GRU+CTC

ocr识别采用GRU+CTC端到到识别技术,实现不分隔识别不定长文字

提供keras 与pytorch版本的训练代码,在理解keras的基础上,可以切换到pytorch版本,此版本更稳定

识别结果展示

文字检测及OCR识别结果

倾斜文字

参考

1.crnn https://github.com/meijieru/crnn.pytorch.git

2.keras-crnn 版本实现参考 https://www.zhihu.com/question/59645822

3.ctpn https://github.com/eragonruan/text-detection-ctpn , https://github.com/tianzhi0549/CTPN

About

运用tensorflow实现自然场景文字检测,keras/pytorch实现crnn+ctc实现不定长中文OCR识别

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 96.3%
  • Cuda 1.9%
  • Other 1.8%

AltStyle によって変換されたページ (->オリジナル) /