-
Notifications
You must be signed in to change notification settings - Fork 69
Open
@djm012
Description
您好,我在做Qwen-VL-7B量化的时候,使用awq_w_only.yml做4bit量化语言层的参数,导出设置了save_vllm=True来保存真实量化模型,但是为什么导出的模型要比原始模型大?(导出的模型28G,原始模型16G)
Metadata
Metadata
Assignees
Labels
No labels