anyforge/anytable

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
assets		assets
det		det
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_en.md		README_en.md
zanshan.jpg		zanshan.jpg

Repository files navigation

AnyTable

Static Badge Static Badge

 ___ ______ __ __ 
 / | ____ __ _/_ __/___ _/ /_ / /__ 
 / /| | / __ \/ / / // / / __ `/ __ \/ / _ \
 / ___ |/ / / / /_/ // / / /_/ / /_/ / / __/
/_/ |_/_/ /_/\__, //_/ \__,_/_.___/_/\___/ 
 /____/

简体中文 | English

1. 简介

AnyTable是一个专注于从文档或者图片中表格解析的模型工具,主要分成两个部分:

anytable-det:用于表格区域检测(已开放)
anytable-rec:用于表格结构识别(未来开放)

项目地址:

github地址:AnyTable
Hugging Face: AnyTable
ModelScope: AnyTable

2. 缘起

目前市面上表格数据非常多且混杂,很难有一个干净的完整数据和模型,为此我们收集并整理了很多表格数据,训练了我们的模型。

检测数据集分布:

pubtables: 947642
synthtabnet.marketing: 149999
tablebank: 278582
fintabnet.c: 97475
pubtabnet: 519030
synthtabnet.sparse: 150000
synthtabnet.fintabnet: 149999
docbank: 24517
synthtabnet.pubtabnet: 150000
cTDaRTRACKA: 1639
SciTSR: 14971
doclaynet.large: 21185
IIITAR13K: 9905
selfbuilt: 121157

数据集总计:大于2.6M(大约2633869张图片)。

扩展训练

训练集:2.6M(大于10万的部分只抽样了42000, 没办法因为贫穷,卡有限。)
测试集:4k
python: 3.12
pytorch: 2.6.0
cuda: 12.3
ultralytics: 8.3.128

模型介绍

表格检测模型位于det文件夹下:

yolo系列:使用ultralytics训练yolo检测
rt-detr:使用ultralytics训练rt-detr检测

注释:您可以直接模型预测,也可以作为预训练模型微调私有数据集

评估

自建评估集:4K

model	imgsz	epochs	metrics/precision
rt-detr-l	960	10	0.97
yolo11s	960	10	0.97
yolo11m	960	10	0.964
yolo12s	960	10	0.978

3. 使用方法

安装依赖

pip install ultralytics pillow

使用方法

## simple
## 下载模型后直接使用ultralytics即可
from ultralytics import YOLO,RTDETR
# Load a model
model = YOLO("/path/to/download_model") # pretrained YOLO11n model
# Run batched inference on a list of images
results = model(["/path/to/your_image"],imgsz = 960) # return a list of Results objects
# Process results list
for result in results:
 boxes = result.boxes # Boxes object for bounding box outputs
 masks = result.masks # Masks object for segmentation masks outputs
 keypoints = result.keypoints # Keypoints object for pose outputs
 probs = result.probs # Probs object for classification outputs
 obb = result.obb # Oriented boxes object for OBB outputs
 result.show() # display to screen
 result.save(filename="result.jpg") # save to disk

Buy me a coffee

微信(WeChat)

特别鸣谢

ultralytics公开的训练模型和文档
各种数据集提供者

Star History

Star History Chart

About

table-detect,table-recog,表格检测识别

Releases

No releases published

Packages

No packages published

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

License

anyforge/anytable

Folders and files

Latest commit

History

Repository files navigation

AnyTable

1. 简介

2. 缘起

扩展训练

模型介绍

评估

3. 使用方法

安装依赖

使用方法

Buy me a coffee

特别鸣谢

Star History

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages

License

anyforge/anytable

Folders and files

Latest commit

History

Repository files navigation

AnyTable

1. 简介

2. 缘起

扩展训练

模型介绍

评估

3. 使用方法

安装依赖

使用方法

Buy me a coffee

特别鸣谢

Star History

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Packages