Stable Diffusion 系列

Stability AI 的 open-weight 图像生成 diffusion 模型家族（SD 1.5、SDXL、SD3、SD 3.5），是 open-source AI 艺术生态的基础。

Stable Diffusion 是 Stability AI 的 open-weight 图像生成模型家族（早期版本有 Runway 跟 CompVis 等重要外部合作）。产品线：Stable Diffusion 1.4/1.5（2022，让 AI 图像生成普及的突破）、SDXL（2023，质量大幅提升）、SD3（2024，multimodal diffusion transformer 架构）、SD 3.5。它重要的原因是：Stable Diffusion 对图像生成的意义就像 Llama 对 LLM——整个生态建立在这个 open foundation 上。Civitai 跟 Hugging Face 上几百个 fine-tune 变体、整个 ControlNet 生态、AnimateDiff 做视频、大多数非商业 AI 艺术工具都追到 SD checkpoint。ComfyUI 跟 Automatic1111 web UI 之所以存在是因为 SD 的 open 权重。 SD 1.5 特别被广泛定制——动漫模型、写实模型、角色 LoRA、风格 LoRA。模型够小（~4 GB）能在消费者 GPU 上跑，几秒生成图像。新的 closed-source 前沿图像生成竞争者——DALL-E 3、Midjourney、Imagen、Flux Pro——通常产生更高的绝对质量。但在定制、fine-tune、可控生成、离线使用上，SD 家族仍是基础。延伸阅读：diffusion model、image generation、ControlNet、LoRA、Flux。