【Stable Diffusion】拡張機能「Dataset Tag Editor」を使って任意の画像からプロンプトを抽出する方法!

こんにちは!悠です!

 

「インターネット上で自分の理想にぴったりのAIイラストを見つけたけれど、それを再現するプロンプトがわからない!」というような経験はありませんか?

 

今回は、こんな悩みを簡単に解決してくれる「Stable Diffusion」の拡張機能「Dataset Tag Editor」を紹介していきます。

なお本来は自作LoRAを生成する際の素材画像にタグ付けを行うツールです。その使い方は下の記事で紹介しています。

【Stable Diffusion】「LoRA Easy Training Scripts」を使って自分だけのLoRAを作る方法を紹介!
ローカル環境で「Stable Diffusion」で使用可能な自作LoRAを作成できる、「LoRA Easy Training Scripts」の使い方について紹介した記事です。

 

アイキャッチ画像は「AbyssOrangeMix3」を使って生成しています!

 

スポンサーリンク
スポンサーリンク

「Dataset Tag Editor」の導入方法

GitHub - toshiaki1729/stable-diffusion-webui-dataset-tag-editor: Extension to edit dataset captions for SD web UI by AUTOMATIC1111
Extension to edit dataset captions for SD web UI by AUTOMATIC1111 - GitHub - toshiaki1729/stable-diffusion-webui-dataset-tag-editor: Extension to edit dataset c...

 

Google Colaboratory版の場合

下記の方法で紹介している「maintained by Akaibu」のノートブックを使って、拡張機能「Dataset Tag Editor」を導入していきます。

まだご覧になっていない方は、まず最初にこちらを準備しておいてください。

【Stable Diffusion】AUTOMATIC1111のWebUIをGoogle Colaboratory上で使う方法!【maintained by Akaibu】
「Stable Diffusion」で、「AUTOMATIC1111」が用意しているノートブック「maintained by Akaibu」を使って、Google Colaboratory上で自分の好きなモデルデータやLoRAを使用する方法についてまとめた記事です。
【Stable Diffusion】AUTOMATIC1111のColab版でLoRAを使う方法について紹介!【maintained by Akaibu】
AUTOMATIC1111のColab版「maintained by Akaibu」でLoRAを使う方法についてまとめた記事です。2.5D風AIコスプレイヤーを作成できる「KoreanStyle2.5D」も紹介しています。

 

Google Driveからモデルデータを読み込むセルの下に新しくセルを作成し、下記のコードを入力してください。

#Dataset Tag Editorをインストール
%cd /content/stable-diffusion-webui/extensions/
!git clone https://github.com/toshiaki1729/stable-diffusion-webui-dataset-tag-editor /content/stable-diffusion-webui/extensions/stable-diffusion-webui-dataset-tag-editor

%cd /content/stable-diffusion-webui

 

WebUIを起動し、「Dataset Tag Editor」のタブが新たに追加されていれば導入は成功です。

 

ローカル版の場合

「Extensions」→「Install from URL」の「URL for extension’s git repository」に下記のURLを入力しInstallをクリックしましょう。

https://github.com/toshiaki1729/stable-diffusion-webui-dataset-tag-editor

 



「Dataset Tag Editor」の使い方

それでは拡張機能「Dataset Tag Editor」を使って、任意の画像からプロンプトを抽出する方法を紹介していきます。

なお、自作LoRAを作る場合のタグ付けの方法もほぼ同じですよ!

 

まずプロンプトを抽出したい画像を、ローカル版の方は任意のフォルダ(パスに日本語が入っていない場所)、Google Colaboratory版の方はGoogle Driveにアップロードしましょう。

私はStable Diffusion系のデータを保存している場所に、imagesというフォルダを作りました(Drive内)。

 

絶対にGoogle Drive上にR18画像(2次元イラストも含む)をアップロードしてはいけません。Googleアカウントが凍結される恐れがあります。1度凍結されると復旧はかなり困難らしいです。

 

ちなみにColab版の方は、左側のファイルからディレクトリを表示して、Drive内に作成したフォルダのパスを確認できます。

 

ここまで準備できたら、「Stable Diffusion WebUI」を起動して「Dataset Tag Editor」のタブを開きましょう。

 

Dataset directoryに先ほど画像を格納したフォルダのパス、Dataset Load SettingsのタブにあるLoad from subdirectoriesLoad caption from filename if no text file existsにチェックを入れます。

Use Interrogator CaptionのOverwriteにチェックを入れ、Interrogatorから好きなものを設定します。

 

このInterrogatorの種類によって抽出できるプロンプト(タグ)が変化します。

私はwd-v1-4-swinv2-tagger-v2を選択しました。

 

Interrogator Settingsを開き、使用したInterrogatorに応じてチェックを入れます。値は変えなくてOKです。

これで設定は完了なので、右上にある「Load」をクリックしましょう。

 

画像からプロンプト(タグ)が抽出されます。

 

このままだとプロンプトとしてコピペしにくいので、txtファイルに結果を出力します。

右側にある「Filter by Selection」のタブを開き、Add All Displayedをクリックした後、一番下のオレンジ色のApply selection filterを選択します。

 

最後に一番上にあるオレンジ色のSave all changesをクリックすれば完了です。

 

画像を格納したフォルダ内に、プロンプトが記載されたtxtファイルが出力されています。

 

あとはコピペして使いましょう。

 

まとめ

以上が「Stable Diffusion」で、自分の好きな画像からプロンプトを抽出してtxtファイルに保存できる拡張機能「Dataset Tag Editor」の使い方でした。

この機能を使えば間違いなく、自分の理想としている1枚の作成に近づくことができるので、ぜひ試してみてください!

個人的には「MultiDiffusion」と「Dataset Tag Editor」が拡張機能のTop2です。

 

では、ここまで読んでいただきありがとうございました。

コメント