ソフトウェア

スポンサーリンク
StableDiffusion

WSL2 Ubuntu 22.04 LTS に Stable Diffusion WebUI v1.7.0 & SDXL 1.0 をインストールする

Windows11 WSL2 Ubuntu 22.04 LTS に Stable Diffusion WebUI v1.7.0 と SDXL 1.0 を新規にインストールする方法についてまとめました。これまで各記事に分散していた有益な情報をまとめて見られるようにしました。
VOICEVOX

WSL2 で VOICEVOX core を使用して合成音声を生成する

Windows11 の WSL2 上に VOICEVOX core の環境を構築し、合成音声の出力を試してみました。現時点の main branch の 0.14.5 では github の手順通りでは Python で合成音声を生成させる事が出来ませんでしたので一工夫しました。
Whisper

WSL2 で Whisper WebUI を使用する

Windows11 WSL2 Ubuntu 23.10 で Whisper WebUI を使用してみました。予め Whisper や Faster-Whisper を構成しておいた Python 仮想環境を利用すると簡単に導入できます。
Whisper

WSL2 上の Whisper / Faster Whisper で音声から文字起こしする

WSL2 の Ubuntu に音声認識 AI の Whisper をインストールし、音声から文字起こしをしてみました。オリジナルの Whisper よりも高速でVRAM 使用量の少ない faster-whisper も同時に使用してみました。
StableDiffusion

Stable Diffusion WebUI を Ver.1.7.0 にアップデートする

WSL2 にセッティングしている Stable Diffusion WebUI を Ver.1.7.0 にアップデートしました。SDXL Turbo の対応を期待していましたが、今回のアップデートには含まれません。そのままでも動作するようですが、生成画像の質を上げられなかったので断念しました。
LLM

Text generation web UI で日本語 LLM の Calm2-7B を使用する方法

大規模言語モデル (LLM) の Web UI である Text generation web UI で、CyberAgent 社から公開された独自の日本語 LLM の Version 2、CyberAgentLM2-7B を使用する方法についてまとめました。
StableDiffusion

Stable Diffusion WebUI を Ver.1.6.0 にアップデートする

WSL2 にセッティングしている Stable Diffusion WebUI を Ver.1.6.0 にアップデートしました。SDXL の refiner モデルが拡張機能不要で適用できます。ウェブブラウザが自動起動するようになったので、設定を変更して以前の動作に戻しました。
StableDiffusion

SDXL 1.0 を Stable Diffusion WebUI で使う方法

2023年7月に公開された Stable Diffusion XL 1.0 を AUTOMATIC1111版の Stable Diffusion WebUI で使用する方法についてまとめました。WSL2 Ubuntu 23.04 (lunar) で CUDA 11.8, Python 3.11, PyTorch 2.0.1 で動作させました。
トラブル対処

Microsoft PowerToys 0.70 の Peek キーバインドに注意

US キーボードを使用していて、IME の切替を Ctrl + Space に設定している場合には、PowerToys 0.70 で追加された機能の Peek とキーバインドが干渉します。私は Peek 側のキーバインドを変更して対処しました。
StableDiffusion

Stable Diffusion WebUI の PyTorch を 2.0 にアップデートする、他

Stable Diffusion WebUI のアップデート方法と、PyTorch を 1.13 -> 2.0 にアップデートする方法をまとめました。PyTorch 2.0 だと xformers を使用せずに同等の速度で画像を生成できるようになります。
スポンサーリンク