Stable Diffusion
Stable Diffusion(ステーブル・ディフュージョン)は、2022年に「GPUが鳴く子も黙る」でおなじみのStability AI社が公開した拡散型(diffusion)画像生成AIである。テキストプロンプトを与えると数秒後には宇宙飛行士が馬にまたがるシュール絵画が出力され、しかもモデル本体はオープンソース――要するに「人類全員に油絵工房を無料配布した」ような暴挙である。[1]
概要[編集 ]
Stable Diffusionは「ノイズの海から絵を釣り上げる」拡散モデルを実装し、GPUさえあれば個人でも高解像度画像を量産できる点が特徴である。2022年8月の公開直後から同人界隈・広告業界・SNSの黒歴史保管庫を同時多発的に炎上させ、以後もLoRAやSDXLといった亜種を産卵し続けている。
名前の由来[編集 ]
「Stable」は"安定"を自称するが、VRAMが少ない環境ほど不安定に落馬するブラックジョーク入り。「Diffusion」は本来"拡散現象"の学術用語であり、アート生成に転職したのはAI界の七不思議の一つである。
開発の経緯[編集 ]
2022年8月22日にVersion 1.4が公開されるや否や「Google Colabで動くぞ!」と世界中のGPUが悲鳴を上げた。同年冬には軽量学習技術LoRAが登場し、二次元美少女の増殖率が指数関数的に上昇。2023年7月のSDXLで解像度が跳ね上がり、2024年10月のSD 3.5でフォトリアル路線が加速した。2025年現在もコミュニティ主導で改造モデルが雪だるま式に増え、「Stableとは爆発的話題性が安定していることだ」という新解釈が定着している。
仕組みと主要機能[編集 ]
拡散モデルは「ノイズをばらまく→取り除く」を学習させることで画像の生成手順そのものを丸ごと覚えさせる。
- テキスト→イメージ
- 例として a cyberpunk takoyaki stand, rainy night を入力すれば、たこ焼き屋台がネオン街に転生する。
- Img2Img
- 下書きを与えて「もっとプロっぽく」と命じると、作者の画風ごとプロ化するので人格崩壊の危険がある。
- Inpainting / Outpainting
- 不要な元カレの顔を消したり、絵の外側1 mを増築したりと、倫理を置き去りにした増改築が得意。
利用シーンと文化的インパクト[編集 ]
同人即売会では「実はAI生成か」を当てるクイズが新たな娯楽に、広告業界では「納期:きのう」の無茶ぶりを物量で殴り返す必殺兵器に、SNSでは愛犬の写真を美少女化する謎ムーブが流行。良くも悪くも「絵を描くハードル」を地下まで掘り下げた存在として語り草になっている。
社会的議論[編集 ]
著作権問題では「勝手に学習された絵師 vs. オープンソース教徒」の泥仕合が続き、ステレオタイプ強化では「プログラマー=白人男性99 %」といった偏見の濃縮還元が実証された[2] 。さらにGPUの電力消費が温暖化を加速するという環境面の指摘もあり、Stable Diffusionは「描く前にまず謝罪文を生成すべきAI」とまで揶揄される。
技術的欠陥と対策[編集 ]
| 欠陥 | 発生例 | よくある対処 |
|---|---|---|
| 著作権ゴロ | 「それ俺の絵じゃん」を量産 | 弁護士か神社に相談 |
| 人体ねじれ | 肩が3つ、指が7本 | –neg hand, bad anatomy で黒魔術/Ctrl‐Z+祈祷 |
| GPU過労死 | ファンが喘ぎ声 | 水冷クーラーかPC前で合掌 |
プロンプト魔術入門[編集 ]
プロンプトは呪文であり、masterpiece, best quality という自己暗示を添えると画質が上がった「気分」になれる。著作権フリー素材サイト写真ACをモデルに食わせる合法ドーピングも定番である。
周辺エコシステム[編集 ]
- LoRA/LyCORIS – 自作キャラやマニアックな地下アイドルの私服まで完全再現する軽量追加学習。
- ControlNet – 「このポーズを守れ」と銃を突きつける警察官。
- ComfyUI – フローチャート厨大歓喜のノードベースUI。配線を組むほど全知全能になった気がする。
未来予想図[編集 ]
2026年には「Stable Diffusionで描かれたStable Diffusionのイラスト」が自律的にNFTを発行し、生成AI同士が著作権で訴え合うというループが予見されている――ソース? そんなものはない、ここはアンサイクロペディアだ。
脚注[編集 ]
- ^ Stable Diffusion – Wikipedia(最終更新 2025‐06‐08 閲覧)
- ^ Tech Policy Press – "Researchers Find Stable Diffusion Amplifies Stereotypes"(2023‐01‐12)
関連項目[編集 ]
- 生成AI
- Diffusionモデル
- Novel AI Diffusion - 初期バージョンはSD1.5派生、かつリークにより外部流出し、結果的に――。
- Midjourney
- DALL·E - 今はGPT-image-1かな。
- Imagen
- Flux.1 - 安定を捨てた黒い森の研究者たちの競合モデル。
- GPU教