Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

OCR dataset Text-Detection dataset Font-Classification dataset generator

Notifications You must be signed in to change notification settings

xgmiao/TextGenerator

Repository files navigation

TextGenerator

  • This is a tools for ocr dataset, text detection, fonts classification dataset generate.
  • 这是一个用来生成ocr数据,文字检测数据,字体识别的最方便的工具

实现的功能:

  • 生成基于不同语料的,不同字体、字号、颜色、旋转角度的文字贴图
  • 支持多进程快速生成
  • 文字贴图按照指定的布局模式填充到布局块中
  • 在图像中寻找平滑区域当作布局块
  • 支持文字区域的图块抠取导出(导出json文件,txt文件和图片文件,可生成voc数据,coco格式coming soon!)
  • 支持用户自己配置各项生成配(图像读取,生成路径,各种概率)

效果预览

生成图片示例:

文字贴图示例:

使用方式

  • 环境安装(Python3.6+,建议使用conda环境)

    # step 1
    pip install requirements.txt
    # step 2
    sh make.sh
    
  • 编辑配置文件config.yml(可选)

  • 执行生成脚本

    python3 run.py
    
  • 生成的数据

    生成的数据存放在config.yml中的provider> layout> out_put_dir指定的目录下。

About

OCR dataset Text-Detection dataset Font-Classification dataset generator

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

AltStyle によって変換されたページ (->オリジナル) /