Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings

licairong123/deep_learning_system

Repository files navigation

项目概述

本仓库项目是个人总结的深度学习炼丹、优化及部署落地笔记,包含深度学习数学基础知识、深度学习基础知识、神经网络基础部件详解、构建 CNN 网络总结、深度学习炼丹策略、深度学习模型压缩算法、以及深度学习推理框架代码解析及动手实战。

一,数学基础专栏

二,神经网络基础部件

1,神经网络基础部件:

  1. 神经网络基础部件-卷积层详解
  2. 神经网络基础部件-BN 层详解
  3. 神经网络基础部件-激活函数详解
  4. 神经网络基础部件-Transformer 详解

2,深度学习基础:

三,深度学习炼丹

  1. 深度学习炼丹-数据标准化
  2. 深度学习炼丹-数据增强
  3. 深度学习炼丹-不平衡样本的处理
  4. 深度学习炼丹-超参数设定
  5. 深度学习炼丹-正则化策略

四,深度学习模型压缩

  1. 深度学习模型压缩算法综述
  2. 模型压缩-轻量化网络设计与部署总结
  3. 模型压缩-剪枝算法详解
  4. 模型压缩-知识蒸馏详解
  5. 模型压缩-量化算法详解

五,模型推理部署

1,模型部署:

2,模型推理:

3,ncnn 框架源码解析:

六,异构计算

  1. 移动端异构计算:neon 编程
  2. GPU 端异构计算:cuda 编程

通用矩阵乘法 gemm 算法解析与优化、neoncuda 编程等内容,以及 ncnn 框架代码解析总结。

七,进阶课程

1,推荐几个比较好的深度学习模型压缩与加速的仓库和课程资料:

  1. awesome-emdl: 嵌入式与移动端深度学习研究资料合集。
  2. AI-System: 深度学习系统。
  3. pytorch-deep-learning

2,一些笔记好的博客链接:

参考资料

chatglm-6b 模型

  • 单机单卡
  • 测试设备 T4
  • 测试 promot:
    • 你是现代诗人,用'红包、美好、表白、夕阳、月光、慢慢'关键词生成2首表白唯美打油诗
    • 写一篇500字的武侠小说,主角名字为李纯白

测试框架:HuggingFace + Transformers + DeepSpeed

Batch_size 数据类型 显存占用 GPU使用率 性能(tokens per second)
1 FP16 13046MiB 83% 14.0~14.7

测试框架:HuggingFace + Transformers

使用 chatglm 自带的量化函数进行量化,虽然对显存的要求低了,但是性能 tps 下降了很多,原因还在分析。

Batch_size 数据类型 显存占用 GPU使用率 性能(tokens per second)
1 FP16 13027MiB 82% 13.23~14.25
1 INT8 7008MiB 89% 14.02

About

深度学习炼丹笔记,包含深度学习数学基础知识、神经网络基础部件详解、构建 CNN 网络总结,深度学习炼丹策略,以及如何实现深度学习推理框架实战。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

Contributors

Languages

  • Python 93.3%
  • C++ 6.7%

AltStyle によって変換されたページ (->オリジナル) /