DLReseach/ColossalAI

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
colossalai		colossalai
configs		configs
csrc		csrc
docs		docs
examples		examples
model_zoo		model_zoo
requirements		requirements
scripts		scripts
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
README.md		README.md
pytest.ini		pytest.ini
setup.py		setup.py

Repository files navigation

Colossal-AI

An integrated large-scale model training system with efficient parallelization techniques.

Paper: Colossal-AI: A Unified Deep Learning System For Large-Scale Parallel Training

Blog: Colossal-AI: A Unified Deep Learning System For Large-Scale Parallel Training

Installation

PyPI

pip install colossalai

Install From Source

git clone git@github.com:hpcaitech/ColossalAI.git
cd ColossalAI
# install dependency
pip install -r requirements/requirements.txt
# install colossalai
pip install .

Install and enable CUDA kernel fusion (compulsory installation when using fused optimizer)

pip install -v --no-cache-dir --global-option="--cuda_ext" .

Documentation

Documentation

Quick View

Start Distributed Training in Lines

import colossalai
from colossalai.trainer import Trainer
from colossalai.core import global_context as gpc
engine, train_dataloader, test_dataloader = colossalai.initialize()
trainer = Trainer(engine=engine,
 verbose=True)
trainer.fit(
 train_dataloader=train_dataloader,
 test_dataloader=test_dataloader,
 epochs=gpc.config.num_epochs,
 hooks_cfg=gpc.config.hooks,
 display_progress=True,
 test_interval=5
)

Write a Simple 2D Parallel Model

Let's say we have a huge MLP model and its very large hidden size makes it difficult to fit into a single GPU. We can then distribute the model weights across GPUs in a 2D mesh while you still write your model in a familiar way.

from colossalai.nn import Linear2D
import torch.nn as nn
class MLP_2D(nn.Module):
 def __init__(self):
 super().__init__()
 self.linear_1 = Linear2D(in_features=1024, out_features=16384)
 self.linear_2 = Linear2D(in_features=16384, out_features=1024)
 def forward(self, x):
 x = self.linear_1(x)
 x = self.linear_2(x)
 return x

Features

Colossal-AI provides a collection of parallel training components for you. We aim to support you to write your distributed deep learning models just like how you write your single-GPU model. We provide friendly tools to kickstart distributed training in a few lines.

Cite Us

@article{bian2021colossal,
 title={Colossal-AI: A Unified Deep Learning System For Large-Scale Parallel Training},
 author={Bian, Zhengda and Liu, Hongxin and Wang, Boxiang and Huang, Haichen and Li, Yongbin and Wang, Chuanrui and Cui, Fan and You, Yang},
 journal={arXiv preprint arXiv:2110.14883},
 year={2021}
}

About

Colossal-AI: A Unified Deep Learning System for Large-Scale Parallel Training

www.colossalai.org/

Releases

1 tags

Packages

No packages published

Languages

Python 94.2%
Cuda 4.6%
Other 1.2%

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

License

DLReseach/ColossalAI

Folders and files

Latest commit

History

Repository files navigation

Colossal-AI

Installation

PyPI

Install From Source

Documentation

Quick View

Start Distributed Training in Lines

Write a Simple 2D Parallel Model

Features

Cite Us

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages

Languages

License

DLReseach/ColossalAI

Folders and files

Latest commit

History

Repository files navigation

Colossal-AI

Installation

PyPI

Install From Source

Documentation

Quick View

Start Distributed Training in Lines

Write a Simple 2D Parallel Model

Features

Cite Us

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages