標準VAEの使い方 (WSL+Ubuntu環境)

[Stable Diffusion] 標準VAEの使い方 (WSL+Ubuntu環境)

※ 当サイトは広告を含みます。

現状VAEってほぼ必須な訳ですが、VAEが用意されてないモデルも多いです。
そんな時にどうするって話なんですが、実はStabilityAIの標準VAEがあります。
本来であれば専用VAEの利用が望ましいのですが、無い時用に導入しておくと便利ですよ。

◆ Stable Diffusion web UIのインストール方法について

◆ VAEの手動切り替え設定について

標準VAEの追加方法

次のコマンドで追加できます。2種類あるので両方とも追加しておきましょう。


cd ~/stable-diffusion-webui
wget https://huggingface.co/stabilityai/sd-vae-ft-ema-original/resolve/main/vae-ft-ema-560000-ema-pruned.safetensors -O ./models/VAE/vae-ft-ema-560000-ema-pruned.safetensors

cd ~/stable-diffusion-webui
wget https://huggingface.co/stabilityai/sd-vae-ft-mse-original/resolve/main/vae-ft-mse-840000-ema-pruned.safetensors -O ./models/VAE/vae-ft-mse-840000-ema-pruned.safetensors

画像生成時のError対策

VAEを利用すると画像生成時にErrorが発生する場合があります。その時に--no-half-vaeを利用しろと言われるので先に対策しておきます。
これは起動オプションに--no-half-vaeを追加すればいいのですが、毎回指定するのは正直めんどいです。なので、Default値に記述しちゃいましょう。

ここが対象となる設定ファイルが存在するディレクトリです。


cd ~/stable-diffusion-webui

そして設定ファイルはこれです。


cat webui-user.sh

この中に次の行があるので、これを変更します。変更はviコマンドとかWindows側から直接ファイルを修正してください。


export COMMANDLINE_ARGS=""

僕の場合は他の引数もあるのでこうなります。


export COMMANDLINE_ARGS="--xformers --no-half-vae"

生成画像の比較

比較で利用するモデルはAnything 5.0です。かなり良さげなモデルなので追加方法は別記事にします。

[] Anything 5.0について

VAE未使用

VAE (未使用)

ParametersSampler: DPM++ 2M Karras, Steps: 20, CFG scale: 7, Seed: 1486638394, Size: 512x512, Model: anything-v5-Prt-RE

Prompt(best quality, masterpiece:1.0), 1 girl, long long hair, blue hair, blue yellow eyes

NegativePrompt(EasyNegative:1.0), extra fingers,fewer fingers, NSFW

VAE利用(vae-ft-ema-560000-ema-pruned)

VAE利用 (vae-ft-ema-560000-ema-pruned)

ParametersSampler: DPM++ 2M Karras, Steps: 20, CFG scale: 7, Seed: 362910291, Size: 512x512, Model: anything-v5-Prt-RE

Prompt(best quality, masterpiece:1.0), 1 girl, long long hair, blue hair, blue yellow eyes

NegativePrompt(EasyNegative:1.0), extra fingers,fewer fingers, NSFW

VAE利用(vae-ft-mse-840000-ema-pruned)

VAE利用 (vae-ft-mse-840000-ema-pruned)

ParametersSampler: DPM++ 2M Karras, Steps: 20, CFG scale: 7, Seed: 448348559, Size: 512x512, Model: anything-v5-Prt-RE

Prompt(best quality, masterpiece:1.0), 1 girl, long long hair, blue hair, blue yellow eyes

NegativePrompt(EasyNegative:1.0), extra fingers,fewer fingers, NSFW

あとがき

かなり汎用的に利用できます。というか使わない場合よりも標準VAEを使ったほうが質が良いです。

この記事は参考になりましたか?

関連記事

コメント

この記事へのコメントはありません。