模型家族
Stable Diffusion 系列
Stable Diffusion (family)
Stability AI 的 open-weight 图像生成 diffusion 模型家族(SD 1.5、SDXL、SD3、SD 3.5),是 open-source AI 艺术生态的基础。
Stable Diffusion 是 Stability AI 的 open-weight 图像生成模型家族(早期版本有 Runway 跟 CompVis 等重要外部合作)。产品线:Stable Diffusion 1.4/1.5(2022,让 AI 图像生成普及的突破)、SDXL(2023,质量大幅提升)、SD3(2024,multimodal diffusion transformer 架构)、SD 3.5。
它重要的原因是:Stable Diffusion 对图像生成的意义就像 Llama 对 LLM——整个生态建立在这个 open foundation 上。Civitai 跟 Hugging Face 上几百个 fine-tune 变体、整个 ControlNet 生态、AnimateDiff 做视频、大多数非商业 AI 艺术工具都追到 SD checkpoint。ComfyUI 跟 Automatic1111 web UI 之所以存在是因为 SD 的 open 权重。
SD 1.5 特别被广泛定制——动漫模型、写实模型、角色 LoRA、风格 LoRA。模型够小(~4 GB)能在消费者 GPU 上跑,几秒生成图像。
新的 closed-source 前沿图像生成竞争者——DALL-E 3、Midjourney、Imagen、Flux Pro——通常产生更高的绝对质量。但在定制、fine-tune、可控生成、离线使用上,SD 家族仍是基础。延伸阅读:diffusion model、image generation、ControlNet、LoRA、Flux。