Name	Name	Last commit message	Last commit date
Latest commit History 50 Commits
.idea	.idea
.gitattributes	.gitattributes
.gitignore	.gitignore
BackSub.py	BackSub.py
Generate_data.py	Generate_data.py
README.md	README.md
TrainRecord.txt	TrainRecord.txt
UI_video.py	UI_video.py
test_multiple.py	test_multiple.py
train_multiple.py	train_multiple.py

ActionDetection

项目描述

基于机器学习的监控视频中人类异常行为检测小程序。
这个程序能做的事就是读取一段视频流,然后判断内容是否属于异常行为。

视频预处理

利用高斯核对视频的帧进行背景减差,做镜像翻转以扩充样本,并分类存放。

效果大概如下图所示:

UI(03/07更新)

实现功能

如下图所示:

运行方式

(训练阶段已完成,过程可以通过代码了解)

模型与Tensorboard: http://pan.baidu.com/s/1jHPdMFc

分类和预处理好的数据: http://pan.baidu.com/s/1kV1B0sZ

将数据和模型解压到根目录下,然后在UI内操作,每隔5帧启动一个20帧的SEQ用来预测:

python UI_video.py

训练过程可视化

cd ActionDetection
tensorboard --logdir=Board/

模型是收敛的。单帧预训练的TensorBoard如下:

Loss/Validation

Accuracy

Accuracy_validation

训练与运行环境

硬件:i7-6700HQ + GTX1060 + 16G DDR4
系统与组件:Win10-64-bit + Cuda-8.0 + Anaconda3-4.1.1 (Python3.5 .ver)
软件包:Tensorflow-gpu-1.0 + Tflearn-0.3.0 + OpenCV-3.2.0 + Numpy-1.12.0

所使用数据集

ICPR 2010 Contest on Semantic Description of Human Activities (SDHA 2010)

所使用算法

单帧预训练:AlextNet (tflearn, 步长0.001)
概率序列训练:双隐层网络 (tensorflow)

DATA包下文件夹内容说明

/ borad

用于存放Tensorboard文件

/ binary_frame

用于存放单帧图训练集, 存放格式为:
---- / binary_frame
 --- /0
 -- 1.png
 -- 2.png
 ..
 --- /1
 -- 3.png
 -- 4.png
 ..
 --- /2
 -- 5.png
 -- 6.png
 ..
 ...
 ...
 ...
本项目有六个类别,对应 0~5 :['handshake', 'hug', 'kick', 'quiet', 'hit', 'push']

/ csv_file

文件夹下有两个文件:
1, seq.csv, 第一次预训练后,对每个视频隔帧取得的概率序列
2, video_labels.csv, 整段视频原有的标签(正常0, 异常1),用作第二次训练的标签

/ file_zip

预训练时Tflearn使用build_image_dataset_from_dir()产生的dataset文件(data.pkl)

/ frame2

所有视频每隔5帧取一帧,帧上注明该帧所属的视频序号和帧数
文件存放格式:
---- /frame2
 --- 0_5.png
 --- 0_10.png
 ...
 --- 5_15.png
 --- 5_20.png
 ...

/ model_alexnet

用于存放第一次训练结束后的tflearn model

/ moddel_nn

用于存放第二次训练结束后的 tensorflow model

/ video

所有视频文件,存放格式为:
---- /video
 --- 0_1_4.avi
 --- 0_11_4.avi
 --- 1_1_2.avi
 ...

脚本

BackSub.py

1, 读取/video下的视频单帧
2, 执行镜像和背景减除操作
3, 存入对应标签的文件夹 /binary_frame

Generate_data.py

1, 对/binary_frame下的单帧图进行预训练
2, 并将结果模型存入/model_alexnet
3, 并对/frame2下所有视频对应的单帧打上概率标签
4, 将每个视频对应的标签概率序列写入seq.csv
5, 将seq.csv存入/csv_file

Train_multiple.py

1,/video下的视频对应的标签写于/csv_file/video_labels.csv
2,每个视频的概率序列已由Generate_data生成于seq.csv
3,将seq.csv作为训练集,video_labels.csv作为标签,使用双隐层进行训练
4,训练结果模型存入/model_nn

Test_multiple.py

二次训练的预测模块

UI_video.py

启动一个PYQT5写成的简单UI,可以读取视频文件并进行预测

mna12478/ActionDetection

Folders and files

Latest commit

History

Repository files navigation