TextGenerator

This is a tool for ocr dataset, text detection, fonts classification dataset generate.
这是一个用来生成ocr数据，文字检测数据，字体识别的很方便的工具

实现的功能：

生成基于不同语料的，不同字体、字号、颜色、旋转角度的文字贴图
支持多进程快速生成
文字贴图按照指定的布局模式填充到布局块中
在图像中寻找平滑区域当作布局块
支持文字区域的图块抠取导出（导出json文件，txt文件和图片文件，可生成voc数据，ICDAR_LSVT数据集格式!）
支持每个文字级别的标注(存入了lsvt的json文件中)
支持用户自己配置各项生成配(图像读取，生成路径，各种概率)

效果预览

生成图片示例:

文字贴图示例:

旋转矩形示例

单个文字包围框示例

使用方式

环境安装(Python3.6+，建议使用conda环境)

# step 1
pip install requirements.txt
# step 2
sh make.sh

编辑配置文件config.yml（可选）
执行生成脚本
```
python3 run.py
```
生成的数据

生成的数据存放在config.yml中的provider> layout> out_put_dir指定的目录下。

Name		Name	Last commit message	Last commit date
Latest commit History 129 Commits
assets		assets
core		core
img		img
libs		libs
service		service
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
config.yml		config.yml
constant.py		constant.py
make.sh		make.sh
requirements.txt		requirements.txt
run.py		run.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TextGenerator

实现的功能：

效果预览

生成图片示例:

文字贴图示例:

旋转矩形示例

单个文字包围框示例

使用方式

About

Releases

Packages

Languages

License

BboyHanat/TextGenerator

Folders and files

Latest commit

History

Repository files navigation

TextGenerator

实现的功能：

效果预览

生成图片示例:

文字贴图示例:

旋转矩形示例

单个文字包围框示例

使用方式

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages