【WD14-Tagger】1クリックで画像からプロンプトを抽出できる拡張機能の紹介!【Stable Diffusion】

こんにちは!悠です!

 

以前インターネット上の画像からプロンプトを抽出する手段として、「Dataset Tag Editor」という拡張機能を紹介いたしました。

【Stable Diffusion】拡張機能「Dataset Tag Editor」を使って任意の画像からプロンプトを抽出する方法!
「Stable Diffusion」で自分の好きな画像からプロンプトを抽出して、txtファイルに保存できる拡張機能「Dataset Tag Editor」の使い方を紹介した記事です。

 

こちらはLoRA学習を行う際、素材画像のタグファイルを簡単に作成できる非常に便利なツールでもあります。

 

しかし、「画像からプロンプトを抽出する」という作業については、この拡張機能よりもはるかに簡単に行える「WD14-Tagger」というものが存在します。

LoRAの自作にそれほど興味がなくプロンプトの抽出だけを行いたい場合は、この「WD14-Tagger」がおすすめです!

 

アイキャッチ画像はモデルに「pikasNewGeneration」、LoRAに「flat2」を使用しています。
スポンサーリンク
スポンサーリンク

「WD14-Tagger」の導入方法

GitHub - toriato/stable-diffusion-webui-wd14-tagger: Labeling extension for Automatic1111's Web UI
Labeling extension for Automatic1111's Web UI. Contribute to toriato/stable-diffusion-webui-wd14-tagger development by creating an account on GitHub.

 

Google Colaboratory版の場合

下記の方法で紹介している「maintained by Akaibu」のノートブックを使って、拡張機能「WD14-Tagger」を導入していきます。

まだご覧になっていない方は、まず最初にこちらを準備しておいてください。

【Stable Diffusion】AUTOMATIC1111のWebUIをGoogle Colaboratory上で使う方法!【maintained by Akaibu】
「Stable Diffusion」で、「AUTOMATIC1111」が用意しているノートブック「maintained by Akaibu」を使って、Google Colaboratory上で自分の好きなモデルデータやLoRAを使用する方法についてまとめた記事です。
【Stable Diffusion】AUTOMATIC1111のColab版でLoRAを使う方法について紹介!【maintained by Akaibu】
AUTOMATIC1111のColab版「maintained by Akaibu」でLoRAを使う方法についてまとめた記事です。2.5D風AIコスプレイヤーを作成できる「KoreanStyle2.5D」も紹介しています。

 

Google Driveからモデルデータを読み込むセルの下に新しくセルを作成し、下記のコードを入力してください。

#WD14-Taggerをインストール
%cd /content/stable-diffusion-webui/extensions/
!git clone https://github.com/toriato/stable-diffusion-webui-wd14-tagger /content/stable-diffusion-webui/extensions/stable-diffusion-webui-wd14-tagger

%cd /content/stable-diffusion-webui

 

WebUIを起動し、Taggerのタブが新たに追加されていれば導入は成功です。

 

ローカル版の場合

「Extensions」→「Install from URL」の「URL for extension’s git repository」に下記のURLを入力しInstallをクリックしましょう。

https://github.com/toriato/stable-diffusion-webui-wd14-tagger

 

 

【2023年8月31日追記】

本家リポジトリの更新が停止し、フォーク版の導入が推奨されるようになったっぽいです。

GitHub - picobyte/stable-diffusion-webui-wd14-tagger: Labeling extension for Automatic1111's Web UI
Labeling extension for Automatic1111's Web UI. Contribute to picobyte/stable-diffusion-webui-wd14-tagger development by creating an account on GitHub.



「WD14-Tagger」で画像からプロンプトを抽出

「WD14-Tagger」を使って画像からプロンプトを抽出する方法は非常に簡単です。

 

Taggerの項目を開き、プロンプトを抽出したい画像をドラッグアンドドロップして、Interrogateのボタンを押すだけです。

なおJPG、PNG以外の画像形式は使えないことがあるので、フリーソフト等でこの2つのどちらかに変換しておいてください。

 

右側に画像から抽出されたプロンプト(正確にはタグ)が表示されます。

 

Interrogatorthresholdを変更するとタグが若干変わるので、抽出されるものが気に食わなければ変更してみてもいいかもしれません。

ただ基本的には初期設定のまま(wd14-vit-v2-git)で特に問題ないと思います。

 

「WD14-Tagger」でLoRA学習用txtファイルの作成

「WD14-Tagger」では、LoRAの学習時に使用するタグ付け用txtファイルを作成することも可能です。

 

まずBatch from directoryのタブを開き、Input directoryに学習用の教師画像を格納したフォルダのパスを入力してください。

Output directoryは空欄、Output filename formatに関してはデフォルトのままでOKです。

 

LoRAのトリガーワード(txtファイルの一番先頭に来るタグ)をAdditional tagsに入力しましょう。

 

これでInterrogateのボタンを押すと、教師画像と同じフォルダ内にタグ付けされたtxtファイルが出力されます。

 

ただこの後、タグの精査(学習したいものを消したりする作業)に移ると思うんですが、これはWebUI上で一括削除できるDataset Tag Editorの方が圧倒的にやりやすいと思います。

「WD14-Tagger」で生成した場合は、1つ1つtxtファイルを開いて手動削除する必要があります。

 

まとめ

以上が「Stable Diffusion WebUI」で、インターネット上の画像から1クリックでプロンプトを抽出できる拡張機能「WD14-Tagger」の紹介でした。

AIイラスト投稿サイトで見つけたお気に入りの画像が、残念ながらメタデータが削除されていてプロンプトを参考にできない場合などに試してみて下さいね!

 

では、ここまで読んでいただきありがとうございました。

コメント

  1. ふぁるこん より:

    LoRA作製用に愛用しています。

    Tag付けは一瞬で終わり、キーワードや除外ワードも入れられ便利なのですが、出来上がったファイルをTrain Toolsのファイル名に合わせてリネームする作業が大変でした。

    それを高速化するために左手キーボードを買ったのですが、それは通常の画像作製作業でも役立っています。

    悠さんがおすすめするDataset Tag Editorはまだ使ったことはないのですが、それは出来上がったテキストファイルを、Train Toolsでそのまま使えるように、任意のファイル名に変更できますか?

    • 悠 より:

      こんにちはです!

      よくよく調べるとこの拡張機能、batch from directoryでtxtファイルの出力、Additional tags でトリガーワードの挿入ができるみたいですね。
      ただ結構試しているんですが、何故か私の環境ではtxtファイルが出力されないんですよね(涙)
      いま試行錯誤中ですw

      タグの削除に関しては、UI上で簡単にチェックボックスを使って消去できるDataset tag editorの方がよさそうな気もします。
      Dataset tag editorでtxtファイルのリネームに関してはまだ試したことがなかったです…!そういう項目はなかった気がしますが、断言できないので後でまた調べてみます!

      【追記】素材画像を格納しているフォルダパスを変更したらできましたwこのあたりの使い方に関しても追記しておきます!

  2. ふぁるこん より:

    いつも返信をありがとうございます。

    Dataset tag editorを触ってみましたが、config.jsonにそのような機能がない限り、出力するテキストファイルを任意のファイル名へ変更できるような項目はなさそうです。

    LoRAの教師ファイルが100枚以上になると、左右差分で200枚以上のテキストファイルをコピーアンドペーストし、対応イメージファイルの名前に合わせてリネームしないといけないので、指がつりそうになるんですよね。。w

    教師ファイルを少なめにするなどして工夫するしかないですね。

    SD関連の話題は悠さんがよく拾ってくれているので、最近は他のAI関連に集中するようにして情報を集められています。
    ありがとうございます。
    集めた情報の中で最近のスマッシュヒットは、One Click Deepfake Videoです。もし、お時間があれば試してみて下さいv

  3. 匿名 より:

    すいません、Taggerの項目って何処にありますでしょうか?
    インストールは完了していて、再起動もしているのですが項目が見つかりません。

    • 悠 より:

      コメントありがとうございます!

      下記の画像のようにタブが追加されていませんでしょうか?
      https://yuuyuublog.org/wp-content/uploads/2023/06/スクリーンショット-1395.png

      もし追加されていない場合は、コンソール(コマンドプロンプト)に何かエラーが表示されていたりしませんでしょうか?

      • 匿名 より:

        返信ありがとうございます。
        今日見てみたら違う場所でしたが表示されていました(topのタグの中)
        UIリセットはしていたのですが、PC再起動でよくなったのかなぁ

        • 匿名 より:

          自身で作成したイラストを読み込ませるとtagが表示されるのですが、
          AIイラスト投稿サイトから保存したファイルを読み込ませるとエラーになってしまいます。
          形式はjpgかpng限定なのですかね、サイトのものはavifという形式のようです。

          • 悠 より:

            ああー私も見た事ありますよその変な拡張子!

            一時期civitaiがそれになってビビりましたw

            Taggerで読み込めるのはjpgかpng形式だけだと思うので、変換ソフト等でavifをpngに変更すればタグを出力できるようになりますよ!

            私のおすすめ画像ビューア「infranview」なら一括置換できます!
            https://www.irfanview.com/

  4. 匿名 より:

    ビューアーソフトおすすめありがとうございます!
    使わせていただきます!