Windows11 WSL2 Ubuntu 22.04 LTS で Stable Diffusion WebUI の環境を構築する

WordPress のアイキャッチ画像を Stable Diffusion で作りたい
最初に試した Stable Diffusion の環境
本家 Stable Diffusion の環境構築～失敗～
Stable Diffusion WebUI の環境構築～成功～
WSL2 Ubuntu 22.04 LTS に Stable Diffusion WebUI の環境を構築する
まとめ
今日のアイキャッチ画像

WordPress のアイキャッチ画像を Stable Diffusion で作りたい

WSL2 含む Ubuntu に NVIDIA CUDA をインストールする方法、アンインストールする方法については「こちらのページ」で紹介しています。複数の CUDA のバージョンが共存できます。

WSL2 含む Ubuntu に NVIDIA cuDNN ライブラリをインストールする方法について「こちらのページ」で紹介しています。cuDNN ライブラリのダウンロードは要ユーザー登録です。

2024年7月7日現在の最新の Stable Diffusion WebUI の最新バージョンは、5月29日に公開された v1.9.4 です。v1.7.0 を SDXL 1.0 を含め WSL2 Ubuntu 22.04 LTS にゼロからインストールする方法は「こちらのページ」、v1.8.0 へバージョンアップする記事は「こちらのページ」、v1.9.0 へバージョンアップする記事は「こちらのページ」に記載しています。

はてなブログの「hiro の長い冒険日記」の頃からの課題ですが、WordPress で日記を書くようになっても毎回悩むのがアイキャッチ画像です。無料の画像を使用するとしても、なかなかイメージに合うものが見つからず、といっても自分の手持ちの写真で風景を撮ったものは多くありません(9割仕事、1割家族)。画像のサイズも 1200 x 630 が最適らしいのですが、トリミングをするのもひと手間を要して、更に悩ましい状態でした。

昨年2022年8月に公開されて大きな話題となった画像生成 AI の Stable Diffusion について、興味はありましたが中々環境構築するまでに至りませんでした。機械学習目当てで購入した nVidia RTX3060 12GB も活用できておらず、なんとかしたいという気持ちが強くなってきました。

そこで、アイキャッチ画像の課題を解消する事と nVidia RTX3060 12GB を活用する事の二つを目的として、画像生成 AI の Stable Diffusion の環境を WSL2 Ubuntu 22.04 LTS に作ってみる事にしました。

20230822 追記 :

最新の Stable Diffusion WebUI をゼロからインストールし、Stable Diffusion XL 1.0 のモデルを使用する方法についてまとめました。PyTorch-2.0.1 & CUDA 11.8 です。

SDXL 1.0 を Stable Diffusion WebUI で使う方法

2023年7月に公開された Stable Diffusion XL 1.0 を AUTOMATIC1111版の Stable Diffusion WebUI で使用する方法についてまとめました。WSL2 Ubuntu 23.04 (lunar) で CUDA 11.8, Python 3.11, PyTorch 2.0.1 で動作させました。

最初に試した Stable Diffusion の環境

「画像を生成するだけのシンプルな構成」という謳い文句に惹かれて、最初に下記のページの方法を試しました。

Stable Diffusion環境構築（pip、windows11、wsl、GeForce） - ちぇちぇの記憶

結局なにが必要なのか分かりにくいどこの記事もごちゃごちゃと必要のないものもたくさんインストールしていてよくわからないので、画像を生成するためだけのシンプルな構成を紹介します。環境 OS: Windows 11 Pro CPU: AMD ...

手順通りに進めるだけで、WSL2 Ubuntu 22.04 LTS で 256 x 256 ピクセルの画像を1枚ずつ作成するシンプルな環境を作る事が出来ました。

PPA (Personal Package Archive) を使う事なく、WSL2 Ubuntu 22.04 LTS の標準の apt line、pip だけで構成されています。環境構築を通して、Python の仮想環境 (venv) やパッケージ管理 (pip) の使い方、Stable Diffusion に必要なパッケージ、学習済みモデル、AI による画像の作成方法等について学びました。

とはいえ、不満もありました。

1枚ずつ作成するので試行錯誤しにくい。直ぐに確認出来ないのでやり直しが多い。
256 x 256 ピクセルで生成されるので、アイキャッチ画像(1200 x 630ピクセル) にするには横に引き伸ばす必要がある
引き延ばした影響もあり、少しぼやけた画像に見える

この環境を使用して何枚かの画像を生成し、PowerToys の Image Resizer で 1200 x 630 に伸張して、アイキャッチ画像に使用しました。

環境構築の始めの一歩としては、勉強になる事の多い経験でした。

本家 Stable Diffusion の環境構築～失敗～

ちゃんとした Stable Diffusion の環境を作ってみたいと考えて、ググってみましたが、先程のページに書かれている「結局なにが必要なのか分かりにくい、ごちゃごちゃと必要のないものもたくさんインストール」の言葉通り、手順通り実行しても真面に動作しませんでした。

そのような中でも手順がシンプルな物を試してみました。

WSL2でStable Diffusion 2.0を使用する - パソコン関連もろもろ

公開日：2022年11月26日最終更新日：2022年12月3日はじめに別記事にWSL2を使わない方法も書いていますので良かったらそちらも読んで下さい。 touch-sp.hatenablog.com PC環境 Ubuntu 20.04 o...

WindowsでStable Diffusion 2.1を使用する（xFormersあり） - パソコン関連もろもろ

公開日：2022年12月10日最終更新日：2023年1月8日はじめに PC環境環境構築実行方法リポジトリのクローンいよいよ実行 Text-to-Image Classic Img2Img はじめにWindowsでStable D...

上記のページは手順がシンプルでしたので、WSL2 の Ubuntu 22.04 LTS、Ubuntu 20.04 LTS で試してみましたが撃沈。環境が作られたように見えても、動作させると進まなかったり、エラーが発生したり、と画像を作成する所までたどり着けませんでした。(私の選んだ環境が良くなかったのだと思います)

Stable Diffusion 2 と 2.1 の学習済みモデルの入手方法が分かったのが収穫でした。最近はユーザー登録不要なんですね。

Stable Diffusion WebUI の環境構築～成功～

その後もググっては試す、の繰り返しでしたが、docker で構築済みの環境を使おうかと考え始めました。

AUTOMATIC1111のセットアップから使い方までを解説｜ Stable Diffusion高機能Web UIの活用法 | Murasan Lab

Stable Diffusionの高機能UIであるAUTOMATIC1111をローカル環境（自宅のゲーミングPCなど）に導入する方法を解説します。AUTOMATIC1111を使用することで、プログラミングを一切必要とせずにStable Di

https://premirea.jp/article/wsl2-stable-diffusion-web-ui

ここで初心に戻って、Stable Diffusion WebUI の公開元のインストール方法を調べてみました(結果的には、これを先に見るべきでした)。公開元の手順でインストールした所、スムーズに環境を構築する事が出来ました。

WSL2 Ubuntu 22.04 LTS に Stable Diffusion WebUI の環境を構築する

GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub...

ここからが本題です。

Windows11 WSL2 Ubuntu 22.04 LTS に Stable Diffusion WebUI の環境を構築する手順について説明します。前提となる環境は以下の通りです。

$ lsb_release -a
No LSB modules are available.
Distributor ID: Ubuntu
Description:    Ubuntu 22.04.1 LTS
Release:        22.04
Codename:       jammy

$ python3 -V
Python 3.10.6

$ dpkg -l | grep -i 'nvidia-cuda-toolkit ' | tr -s ' ' ' '
ii nvidia-cuda-toolkit 11.5.1-1ubuntu1 amd64 NVIDIA CUDA development toolkit

$ nvidia-smi
Wed Feb 15 23:02:17 2023
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.89.02    Driver Version: 528.49       CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
...snip...

Windows11 の nVidia RTX3060 用のドライバは最新にしています。nvidia-smi コマンドは Ubuntu 側ではなく Windows11 側でビデオカードのドライバから用意されます。

nvidia-cuda-toolkit は nVIDIA のサイトからダウンロードする 11.6 で紹介している記事が多いですが、Ubuntu 22.04 の apt にある 11.5 でも Stable Diffusion WebUI は動作します。

Windows11 に WSL2 Ubuntu 22.04 LTS をインストール

こちらは事例がたくさんありますので省略します。Microsoft Store でも wsl --install でもどちらでも構いません

WSL2 Ubuntu 22.04 LTS を最新の環境にアップデート

こちらも事例がたくさんあります。以下のコマンドを実行すればOKです。

$ sudo apt update
$ sudo apt -y upgrade

必要なパッケージを事前準備

事前に必要なパッケージは、WebUI のページに書かれています。

GitHub - AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

Stable Diffusion web UI. Contribute to AUTOMATIC1111/stable-diffusion-webui development by creating an account on GitHub...

# Debian-based:
sudo apt install wget git python3 python3-venv

これに加えて nvidia-cuda-toolkit パッケージをインストールしておく必要があります。

sudo apt install nvidia-cuda-toolkit

前述の通り、バージョンは 1.15 ですが動作しますので問題ありません。

Stable Diffusion WebUI のインストール

Stable Diffusion WebUI のインストール方法は三種類あります。

webui.sh のみダウンロードして実行 (Automatic Installation on Linux)
github から clone (preferred way: using git)
zip ファイル落として展開 (alternative way)

おすすめは2番目の方法です。以下、2番目の方法でのインストール方法について記載します。

git clone でインストール

git clone

ユーザーの home ディレクトリで git clone コマンドを実行します。

$ cd
$ git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

すると、~/stable-diffusion-webui 以下に WebUI がクローンされます。

webui_user.sh の編集

xformers を有効にするために、webui_user.sh 内の COMMANDLINE_ARGS の先頭の # を消して有効にして、xformers のオプションを入力します。

export COMMANDLINE_ARGS="--xformers"

こうする事で xformers が pip でインストールされます(xformers をコンパイルする必要はありません)。nVidia RTX3060 12GB の場合は大丈夫でしたが、メモリ不足等を生じる場合には、こちらにオプションを追記します。

学習済みモデルのダウンロード

~/stable-diffusion-webui/models/Stable-diffusion のディレクトリで、以下のコマンドで学習済みモデルをダウンロードします。最初はどれか一つがあれば良いかと思います。それぞれ5GB以上ありますので、ダウンロードにはそれなりに時間を要します。

Ver.2.1 : v2-1_768-ema-pruned

$ wget https://huggingface.co/stabilityai/stable-diffusion-2-1/resolve/main/v2-1_768-ema-pruned.safetensors

Ver.2.1 : v2-1_512-ema-pruned

$ wget https://huggingface.co/stabilityai/stable-diffusion-2-1-base/resolve/main/v2-1_512-ema-pruned.safetensors

Ver.2.0 : 768-v-ema

$ wget https://huggingface.co/stabilityai/stable-diffusion-2/resolve/main/768-v-ema.safetensors

ckpt ではなく safetensors なのは以下の理由です。

AIモデルのsafetensors形式とは何者か？ckptと比較しつつ解説する

HuggingFaceが主導するsafetensors形式のファイルは、従来のckpt形式のファイルと比べてどのような利点があるのか、なぜ安全になるのかをわかりやすく解説します。また、ckptファイルの危険性についても詳しく解説しています

webui.sh の実行　(インストール)

~/stable-diffusion-webui 以下で webui.sh を実行すれば、必要なパッケージのインストールが始まります。

$ ./webui.sh
...snip...
Running on local URL:  http://127.0.0.1:7860

初回のみインストールに時間を要しますが、2回目以降は直ぐに起動します。

ブラウザで接続

'a photo of an astronaut riding a horse on mars' です。

Windows11 WSL2 Ubuntu 22.04 LTS で動作している Stable Diffusion WebUI

nVidia RTX3060 12GB で 4枚生成して20秒位です。Width と Height を指定すれば、1200 x 630 ピクセルの画像も作成できます。

webui.sh について

webui.sh が便利に出来ています。

github からの pull
python venv による仮想環境の構築
パッケージのインストール (pip)　インストール済みならスキップ
学習済みモデルの確認　インストールされていなければ一旦停止して催促
全てインストール済みなら Web サーバとして起動

という形で、必要なパッケージをインストール & 確認して、必要なら再インストールしてくれます。

まとめ

Windows11 の WSL2 Ubuntu 22.04 LTS に Stable Diffusion WebUI の環境を構築しました。

まだ使い始めで、呪文の作り方や他の機能を少しずつ試している所です。当初想定していたよりも画像の生成は速いと感じました。768 x 768 ピクセルなら 4枚で20秒、1200 x 630 ピクセルなら4枚で30秒程です。

これでちゃんと画像の生成は出来ていますが、もし間違い等ありましたらコメント欄から教えて頂けると幸いです。

今日のアイキャッチ画像

Stable Diffusion WebUI で 'a photo of an astronaut riding a horse on mars' で 1200 x 630 ピクセルで作成した画像です。この先も呪文を勉強します。