GitHub - idlzy/DL: Deep Learning

Name	Name	Last commit message	Last commit date
Latest commit History 36 Commits
classification	classification
detect	detect
tools	tools
LICENSE	LICENSE
README.md	README.md
requirements.txt	requirements.txt

深度学习领域经典模型算法复现

项目介绍 Introduction
图像分类模型 Images Classification
目标检测模型 Object Detection
图像分割模型 Image Segmentation
相关文件下载 Related File Download
所需环境 Environment
项目准备 Project preparation
训练步骤 Train Model
预测推理 Predict and Infer
作者 Author
项目计划表 Project Schedule

项目介绍

DL为Deep learning的简称。深度学习近年来在计算机视觉,自然语言处理,推荐系统等领域取得了很多成果,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大的进步。因此,为了学习和保存这些先进技术,我们开源了DL这个项目。该项目将复现深度学习计算机视觉领域诸多优秀算法,供大家学习交流。

图像分类模型

LeNet
AlexNet
VGGNet
Googlenet
ResNet
MoblieNetv1
Xception
DenseNet
ShuffleNet
MoblieNetv2
EfficientNet
EfficientNetv2

50%......更新中....

目标检测模型

R-CNN
OverFeat
Fast-RCNN
YOLOv1
YOLOv2
SSD
Faster-RCNN
Mask-RCNN
YOLOv3
RetinaNet
YOLOv4

更新中....

图像分割模型

U-Net
U-Net++

更新中....

所需环境

lxml==4.9.3
numpy==1.24.4
opencv_contrib_python==4.8.1.78
opencv_python==4.8.1.78
PyQt5==5.15.10
PyQt5_sip==12.13.0
PyYAML==6.0.1
torch==2.1.0+cu121
torchsummary==1.5.1
torchvision==0.16.0+cu121
tqdm==4.66.1

项目准备

将仓库克隆到本地

git clone https://github.com/idlzy/DL.git
cd DL

在项目根目录下创建存放存放数据集的文件夹(分别用于存放图像分类任务、目标检测任务所需的数据)

mkdir -p data/Classification
mkdir -p data/ObjectDetection

安装环境

pip install -r requirements.txt

训练步骤

1. 图像分类示例

将数据集解压好放置在上一步创建的文件夹下,其文件结构如下

├─data
│ ├─Classification
│ │ └─dataset_kaggledogvscat
│ │ ├─data
│ │ │ ├─cat
│ │ │ └─dog
│ │ └─train_val_info

在分类任务里,数据集放在data下,同级的train_val_info在数据集对应的yaml文件中被指定(可参考cat_vs_dog.yaml),用于存放包含训练集和验证集的图像路径和图像标签,目录里的文件为txt文件类型。

生成类别字典(windows系统下路径中使用'\',而Linux系统下路径使用'/')

python tools/generate_classdic.py -f data/Classification/dataset_kaggledogvscat/data -s catdog.yaml

生成的类别字典将输入到-s选项所指定的文件里,然后我们需要将生成的类别字典复制到我们的data配置信息里,如文件classification\configs\data\cat_vs_dog.yaml

BaseDir: "data/Classification/dataset_kaggledogvscat"
DataDir: "data"
TrainvalDir: "train_val_info" 
split_rate: 0.8
train_num_workers : 2
val_num_workers : 2
class_dic:
 cat: 0
 dog: 1

其中split_rate表示训练集占全部数据的比例,其他部分为验证集 train_num_workers 和 val_num_works 分别表示训练集、验证集的数据读取线程数。 DataDir表示的目录里存放每个类别的图片

生成训练集和验证集

python tools/generate_trainval.py -y classification/configs/dataset/cat_vs_dog.yaml -m none

其中 -y 选项为已经写好了类别字典的数据集配置文件,-m 为数据格式。默认为none,表示是分类数据集,其他可选项有voc、coco等划分好了的训练集和验证集将存入使用的数据集配置文件里TrainvalDir所表示的目录下。

模型训练

在网络的配置文件中,如文件classification\configs\net\alexnet.yaml

# config info 
model_name : "ResNet18" # model_name: you can select from those [RseNet18 ResNet34 ResNet50 ResNet101 ResNet152]
logs_save_path : "logs"
# config hyper-parameters
input_size : 224 # images input size
class_num : 2 # output size (class numbers)
EPOCH : 100 # epoch nums
batch_size : 8 # batch size numbers
batch_size_val: 4 # val batch size numbers
lr : 0.1 # init learing rate
EarlyStop : True # Whether to adopt early stop strategy
EarlyStopEpoch : 15 # Stop training if accuracy has not improved after 15 epochs

logs_save_path(相对于项目跟目录)用来指定模型参数和训练指标数据的保存位置我们可以修改该文件中的超参数来进行模型的调节

最后我们在终端项目根目录下运行如下命令开始训练模型

python classification/utils/train.py -d cat_vs_dog.yaml -n resnet.yaml

这里用-f选项指定数据集配置文件,-n选项指定模型配置文件。需要注意的是。如果配置文件放在了detect/configs/data或detect/configs/net目录下,是不需要写路径的,只需要写文件名称即可,而对于未放在该目录下的配置文件,则需要写为准确的文件路径,并设置-o选项为true,如

python classification/utils/train.py -d /home/ricardo/cat_vs_dog.yaml -n /home/ricardo/resnet.yaml -o true

2. 目标检测示例

将数据集解压好放置在上一步创建的文件夹下,其文件结构如下

├─data
│ └─ObjectDetection
│ └─VOC2007
│ ├─Annotations
│ ├─JPEGImages
│ ├─labels
│ └─train_val_info

在目标检测任务里,图像放在JPEGImages,而标签文件如果是voc格式即标签为xml格式,则放在Annotations文件夹下。如果标签文件为yolo格式,则放在labels文件夹下。同级的train_val_info在数据集对应的yaml文件中被指定(可参考voc.yaml),用于存放包含训练集和验证集的图像路径和图像标签,目录里的文件为txt文件类型。

生成类别字典(windows系统下路径中使用'\',而Linux系统下路径使用'/')

python tools/generate_classdic.py -f data/ObjectDetection/VOC2007 -s voc.yaml

生成的类别字典将输入到-s选项所指定的文件里,然后我们需要将生成的类别字典复制到我们的data配置信息里,如文件detect\configs\data\voc.yaml

VOCDIR: "data/ObjectDetection/VOC2007"
TrainvalDir: "train_val_info" # This directory is used to store information on training and validation data, you just need to create it or don't care it
split_rate: 0.8
train_num_workers : 4
val_num_workers : 4
class_dic:
 dog: 0
 person: 1
 train: 2
 sofa: 3
 chair: 4
 car: 5
 pottedplant: 6
 diningtable: 7
 horse: 8
 cat: 9
 cow: 10
 bus: 11
 bicycle: 12
 aeroplane: 13
 motorbike: 14
 tvmonitor: 15
 bird: 16
 bottle: 17
 boat: 18
 sheep: 19

生成训练集和验证集

python tools/generate_trainval.py -y detect/configs/dataset/voc.yaml -m voc

其中 -y 选项为已经写好了类别字典的数据集配置文件,-m 为数据格式。默认为none,表示是分类数据集,其他可选项有voc、coco、yolo等划分好了的训练集和验证集将存入使用的数据集配置文件里TrainvalDir所表示的目录下。

模型训练

在网络的配置文件中,如文件detect\configs\net\yolo.yaml

# config info
model_name : "YOLO"
logs_save_path : "logs"
# config hyper-parameters
input_size : 448 # images input size
class_num : 20 # output size (class numbers)
EPOCH : 100 # epoch nums
batch_size : 2 # batch size numbers
batch_size_val: 1 # val batch size numbers
lr : 0.01 # init learing rate
EarlyStop : True # Whether to adopt early stop strategy
EarlyStopEpoch : 15 # Stop training if accuracy has not improved after 15 epochs

python detect/utils/train.py -d voc.yaml -n yolo.yaml

python detect/utils/train.py -d /home/ricardo/voc.yaml -n /home/ricardo/yolo.yaml -o true

预测推理

目前我们实现了两种预测推理方式,分别是命令行推理,和带GUI(图形化界面)推理。两者都在classification/utils/目录下。
更新中。。。。。

作者

Name: Ricardo

Email: 1437633423@qq.com

如有问题可邮箱留言。

项目计划表

在12月22号前,实现YOLO模型
在1月7号前,实现所有目前常见的图像分类模型
在1月15号前,实现图像分割模型U-Net
在2月8号前,实现YOLOv2和YOLOv3模型
在3月1号前,实现YOLOV4
在3月15号前,实现YOLOV5
在3月25号前,实现RCNN
在4月5号前,实现Fast-RCNN
在4月15号前,实现Faster-RCNN
在4月30号前,实现Mask-RCNN
在5月15号前,实现SSD
在6月1号前,实现YOLOx
在6月15号前,实现YOLOv6
在6月30号前,实现YOLOv7
在7月15号前,实现YOLOv8
在7月22号前,实现U-Net++
在9月1号前,项目开启自然语言处理和深度强化学习领域

License

idlzy/DL

Folders and files

Latest commit

History

Repository files navigation

深度学习领域经典模型算法复现

目录

项目介绍

图像分类模型

目标检测模型

图像分割模型

相关文件下载

数据集下载

所需环境

项目准备

将仓库克隆到本地

在项目根目录下创建存放存放数据集的文件夹(分别用于存放图像分类任务、目标检测任务所需的数据)

安装环境

训练步骤

1. 图像分类示例

将数据集解压好放置在上一步创建的文件夹下,其文件结构如下

生成类别字典(windows系统下路径中使用'\',而Linux系统下路径使用'/')

生成训练集和验证集

模型训练

2. 目标检测示例

将数据集解压好放置在上一步创建的文件夹下,其文件结构如下

生成类别字典(windows系统下路径中使用'\',而Linux系统下路径使用'/')

生成训练集和验证集

模型训练

预测推理

作者

项目计划表

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages