こんにちは!悠です!
今回は「Stable Diffusion」で、CFG Scaleをデフォルトの7より上げても画像が破綻しにくくなる拡張機能「sd-dynamic-thresholding(CFG Scale Fix)」を紹介していきます。
この拡張機能との併用が推奨されている、「Flat-2D Animerge」というモデルデータを例にしながら使い方をまとめていきますね!
CFG Scaleとは?
AIイラストを生成する際に必ず目に入ってくる設定項目の1つがCFG Scaleです。
これは、入力したプロンプトがどの程度生成されるAIイラストに影響を与えるのか、その影響力を表す数値のことです。
数値を大きくすればするほど、プロンプトを無視した出力が減りますが、画像の色彩が変になったり構図が崩壊したりするようになります。
下げるほど画像がぼやけていきますが、生成されるAIイラストの自由度が向上するようです。
特に指定がない限り、デフォルトの7を使うのが無難だと言われています。
CFG Scaleに関しては、下記の記事がとても参考になります。

拡張機能「CFG Scale Fix」とは?
例えば今回紹介する漫画風のイラスト専用のモデルデータ「Flat-2D Animerge」では、CFG Scaleを13.5に設定することが推奨されています。
デフォルトと比べて2倍近いCFG Scaleの値なので、普通に使うと画像の色彩が崩壊気味になってしまいます。
そこで活躍するのが拡張機能「CFG Scale Fix」です。導入して拡張機能を有効にするだけで、色の問題を大幅に改善することができます。
モデルデータ「Flat-2D Animerge」を使い、CFG Scale = 13.5で「CFG Scale Fix」を有効化した場合と無効化した場合の画像を貼っておきます。なお、プロンプトやSeed値などの他の設定は全て同じです。
【CFG Scale Fix無し】
【CFG Scale Fix有り】
「CFG Scale Fix」の導入方法
Google Colaboratory版の場合
下記の方法で紹介している「maintained by Akaibu」のノートブックを使って、拡張機能「CFG Scale Fix」を導入していきます。
まだご覧になっていない方は、まず最初にこちらを準備しておいてください。


Google Driveからモデルデータを読み込むセルの下に新しくセルを作成し、下記のコードを入力してください。
#CFG Scale Fixをインストール %cd /content/stable-diffusion-webui/extensions/ !git clone https://github.com/mcmonkeyprojects/sd-dynamic-thresholding /content/stable-diffusion-webui/extensions/sd-dynamic-thresholding %cd /content/stable-diffusion-webui
WebUIを起動し、txt2imgとimg2imgのタブに「Enable Dynamic Thresholding」の項目が追加されていれば導入は成功です。
ローカル版の場合
「Extensions」→「Install from URL」の「URL for extension’s git repository」に下記のURLを入力しInstallをクリックしましょう。
https://github.com/mcmonkeyprojects/sd-dynamic-thresholding
「CFG Scale Fix」の使い方
「CFG Scale Fix」の使い方はいたって簡単で、Enable Dynamic Thresholdingにチェックを入れ、Mimic CFG Scaleに適切な値を入力しましょう。
例えばモデルデータ「Flat-2D Animerge」の場合は、Mimic CFG Scale = 4.5が推奨されています。
これで色の破綻なく、高いCFG Scaleの値を使うことができます。
まとめ
以上が「Stable Diffusion」で、CFG Scaleをデフォルトの7より上げても画像が破綻しにくくなる拡張機能「sd-dynamic-thresholding(CFG Scale Fix)」の紹介でした。
自分の使いたいモデルデータの概要欄に、高めのCFG Scaleが設定されている場合はぜひ導入してみてくださいね!
では、ここまで読んでいただきありがとうございました。
コメント