这是一个基于 PyQt5 和 Diffusers 库构建的轻量级、本地化的AI绘画(文生图)工具。
它旨在提供一个最小化、开箱即用的体验,让用户无需复杂的环境配置,就能在自己的电脑上利用 Stable Diffusion 模型进行图像生成。该项目也是我在AI模型工程化、GUI开发和全栈开发思想上的一次个人实践。
- 本地化模型管理: 自动扫描并加载本地的 Stable Diffusion (
.safetensors,.ckpt) 和 LoRA 模型。 - 简洁的用户界面: 提供核心参数调整,如正负向提示词、图像尺寸、生成步数、LoRA启用与权重调整等。
- 动态模型加载: 支持在运行时切换不同的基础模型和LoRA模型,无需重启程序。
- 异步生成与UI解耦: 使用
QThread将耗时的模型加载和图像生成任务放入子线程,避免UI界面卡死,提升用户体验。 - 优化生成流程:
- 通过设置环境变量解决
Hugging Face国内网络访问问题。 - 允许用户自定义模型缓存路径,避免占用C盘空间。
- 集成了
DPMSolverMultistepScheduler调度器,在较低采样步数下也能获得高质量生成结果。
- 通过设置环境变量解决
- EXE 跨平台打包: 支持使用
PyInstaller打包为Windows可执行文件,实现真正的"开箱即用"。
- 前端 (GUI):
PyQt5 - AI / 后端核心:
PyTorch: 深度学习基础框架。Diffusers: 来自Hugging Face的核心库,用于加载和运行Stable Diffusion模型。Transformers: 支持模型中的文本编码器等组件。
- 核心依赖:
numpy,Pillow
本仓库仅包含源代码,不包含任何模型文件。
-
克隆仓库
git clone https://github.com/a752844b/pixel-art-generator.git cd pixel-art-generator -
安装依赖 建议在虚拟环境中进行安装,以隔离项目环境。
# (可选) 创建并激活虚拟环境 # python -m venv venv # source venv/bin/activate (Linux/macOS) # venv\Scripts\activate (Windows) pip install -r requirements.txt
-
准备模型文件
- 在项目根目录下,手动创建
sd_models和lora_models文件夹。 - 将你的 Stable Diffusion 模型 (如
.safetensors文件) 放入sd_models文件夹。 - 将你的 LoRA 模型放入
lora_models文件夹。
- 在项目根目录下,手动创建
-
运行程序
python main.py
Note: 首次运行
main.py时,Diffusers库会自动从Hugging Face Hub下载所选模型必需的配置文件(如model_index.json,scheduler.json等)。代码已配置使用国内镜像源,并默认缓存到项目内的./hf_cache目录,无需额外网络配置。