Yi Jiang enjoyyi00

🎯

Focusing

Large Language Model & Generative Models

Achievements

FoundationVision/VAR FoundationVision/VAR Public

[NeurIPS 2024 Best Paper Award][GPT beats diffusion🔥] [scaling laws in visual generation📈] Official impl. of "Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction". A...

Jupyter Notebook 8.7k 570
FoundationVision/Waver FoundationVision/Waver Public

Industry-level video foundation model for unified Text-to-Video (T2V) and Image-to-Video (I2V) generation.

942 122
FoundationVision/Liquid FoundationVision/Liquid Public

(Accepted by IJCV) Liquid: Language Models are Scalable and Unified Multi-modal Generators

Python 643 35
FoundationVision/Groma FoundationVision/Groma Public

[ECCV2024] Grounded Multimodal Large Language Model with Localized Visual Tokenization

Python 587 44
FoundationVision/UniTok FoundationVision/UniTok Public

[NeurIPS 2025 Spotlight] A Unified Tokenizer for Visual Generation and Understanding

Python 527 12
FoundationVision/Infinity FoundationVision/Infinity Public

[CVPR 2025 Oral]Infinity ∞ : Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis

Python 1.6k 93