【Stable Diffusion】CFG Scaleを上げても画像が破綻しなくなる拡張機能「sd-dynamic-thresholding」の紹介!

こんにちは!悠です!

 

今回は「Stable Diffusion」で、CFG Scaleをデフォルトの7より上げても画像が破綻しにくくなる拡張機能「sd-dynamic-thresholding(CFG Scale Fix)」を紹介していきます。

この拡張機能との併用が推奨されている、「Flat-2D Animerge」というモデルデータを例にしながら使い方をまとめていきますね!

「Flat-2D Animerge」はCivitaiからダウンロードすることができます。今回のアイキャッチ画像にも使用しています。
スポンサーリンク
スポンサーリンク

CFG Scaleとは?

 

AIイラストを生成する際に必ず目に入ってくる設定項目の1つがCFG Scaleです。

これは、入力したプロンプトがどの程度生成されるAIイラストに影響を与えるのか、その影響力を表す数値のことです。

 

数値を大きくすればするほど、プロンプトを無視した出力が減りますが、画像の色彩が変になったり構図が崩壊したりするようになります。

下げるほど画像がぼやけていきますが、生成されるAIイラストの自由度が向上するようです。

特に指定がない限り、デフォルトの7を使うのが無難だと言われています。

 

CFG Scaleに関しては、下記の記事がとても参考になります。

Stable DiffusionのClassifier Free Guidance(CFG)への理解を深める - Qiita
はじめにこの記事は、Stable DiffusionのClassifier Free Guidance(以下、CFG)の簡単な仕組みの説明記事です。対象読者Stable Diffusionで普段あまりよくわからず設定してい...

 

拡張機能「CFG Scale Fix」とは?

例えば今回紹介する漫画風のイラスト専用のモデルデータ「Flat-2D Animerge」では、CFG Scaleを13.5に設定することが推奨されています。

 

デフォルトと比べて2倍近いCFG Scaleの値なので、普通に使うと画像の色彩が崩壊気味になってしまいます。

そこで活躍するのが拡張機能「CFG Scale Fix」です。導入して拡張機能を有効にするだけで、色の問題を大幅に改善することができます。

 

モデルデータ「Flat-2D Animerge」を使い、CFG Scale = 13.5で「CFG Scale Fix」を有効化した場合と無効化した場合の画像を貼っておきます。なお、プロンプトやSeed値などの他の設定は全て同じです。

 

【CFG Scale Fix無し】

 

【CFG Scale Fix有り】

 

「CFG Scale Fix」の導入方法

GitHub - mcmonkeyprojects/sd-dynamic-thresholding: Dynamic Thresholding (CFG Scale Fix) for SD Auto WebUI
Dynamic Thresholding (CFG Scale Fix) for SD Auto WebUI - GitHub - mcmonkeyprojects/sd-dynamic-thresholding: Dynamic Thresholding (CFG Scale Fix) for SD Auto Web...

 

Google Colaboratory版の場合

下記の方法で紹介している「maintained by Akaibu」のノートブックを使って、拡張機能「CFG Scale Fix」を導入していきます。

まだご覧になっていない方は、まず最初にこちらを準備しておいてください。

【Stable Diffusion】AUTOMATIC1111のWebUIをGoogle Colaboratory上で使う方法!【maintained by Akaibu】
「Stable Diffusion」で、「AUTOMATIC1111」が用意しているノートブック「maintained by Akaibu」を使って、Google Colaboratory上で自分の好きなモデルデータやLoRAを使用する方法についてまとめた記事です。
【Stable Diffusion】AUTOMATIC1111のColab版でLoRAを使う方法について紹介!【maintained by Akaibu】
AUTOMATIC1111のColab版「maintained by Akaibu」でLoRAを使う方法についてまとめた記事です。2.5D風AIコスプレイヤーを作成できる「KoreanStyle2.5D」も紹介しています。

 

Google Driveからモデルデータを読み込むセルの下に新しくセルを作成し、下記のコードを入力してください。

#CFG Scale Fixをインストール
%cd /content/stable-diffusion-webui/extensions/
!git clone https://github.com/mcmonkeyprojects/sd-dynamic-thresholding /content/stable-diffusion-webui/extensions/sd-dynamic-thresholding

%cd /content/stable-diffusion-webui

 

WebUIを起動し、txt2imgとimg2imgのタブに「Enable Dynamic Thresholding」の項目が追加されていれば導入は成功です。

 

ローカル版の場合

「Extensions」→「Install from URL」の「URL for extension’s git repository」に下記のURLを入力しInstallをクリックしましょう。

https://github.com/mcmonkeyprojects/sd-dynamic-thresholding

 

 

「CFG Scale Fix」の使い方

「CFG Scale Fix」の使い方はいたって簡単で、Enable Dynamic Thresholdingにチェックを入れ、Mimic CFG Scaleに適切な値を入力しましょう。

例えばモデルデータ「Flat-2D Animerge」の場合は、Mimic CFG Scale = 4.5が推奨されています。

 

これで色の破綻なく、高いCFG Scaleの値を使うことができます。



まとめ

以上が「Stable Diffusion」で、CFG Scaleをデフォルトの7より上げても画像が破綻しにくくなる拡張機能「sd-dynamic-thresholding(CFG Scale Fix)」の紹介でした。

自分の使いたいモデルデータの概要欄に、高めのCFG Scaleが設定されている場合はぜひ導入してみてくださいね!

では、ここまで読んでいただきありがとうございました。

コメント