Yuqian Yuan CircleRadon

💭

Through it all

Computer Vision; PhD student@ZJU

Achievements

Osprey Osprey Public

[CVPR2024] The code for "Osprey: Pixel Understanding with Visual Instruction Tuning"

Python 833 43
TokenPacker TokenPacker Public

The code for "TokenPacker: Efficient Visual Projector for Multimodal LLM", IJCV2025

Python 270 9
DAMO-NLP-SG/PixelRefer DAMO-NLP-SG/PixelRefer Public

[CVPR 2025] The code for "VideoRefer Suite: Advancing Spatial-Temporal Object Understanding with Video LLM"

Jupyter Notebook 270 13
DAMO-NLP-SG/VideoLLaMA3 DAMO-NLP-SG/VideoLLaMA3 Public

Frontier Multimodal Foundation Models for Image and Video Understanding

Jupyter Notebook 1k 75
alibaba-damo-academy/RynnEC alibaba-damo-academy/RynnEC Public

RynnEC: Bringing MLLMs into Embodied World

Jupyter Notebook 370 17
EvolvingLMMs-Lab/lmms-eval EvolvingLMMs-Lab/lmms-eval Public

One-for-All Multimodal Evaluation Toolkit Across Text, Image, Video, and Audio Tasks

Python 3.2k 392