SillyTavernとAUTOMATIC1111を連携させてAIとの会話から画像生成を試みた結果【ローカルLLM設定方法Part05】

今回何をやるかというと、要はこれです。
ローカル環境で「私があなたをどう扱ってきたのかを画像にしてください」をやります。
SillyTavernとAUTOMATIC1111が導入済みの状態から設定開始です。

ちなみに途中で挫折しました。
正確には途中で満足して最後までやらなかったいうか。
設定自体は超簡単だった。

【１：webui-user.batを書き換えてAPI有効で起動する】
COMMANDLINE_ARGS=–api

こんな感じに、–apiを付け加えて保存して起動。

【２：SillyTavern側の拡張機能の画像生成欄を書き換えて接続】
ソース
Stable Diffusion Web UI (AUTOMATIC1111)
SD Web UI URL
http://127.0.0.1:7860/

これにして接続をぽちっと。

画像で見るとあの辺り。
オプション関係は、VLモデルとかじゃないと効かない感じ？
あんまり試してないのでよくわかりません。

【３：実際に画像生成してみた】
会話欄の左下のペンマークの中の画像生成をポチっと。

この画像は、特に何かを指定したということもなく、特に意図も何もないです。
会話の最後のメッセージをプロンプトに変換しただけのやつ。
どこまで指定出来るかとか特に試してないです。

適当な会話で生成すると、それっぽい雰囲気の女の子画像が出てくる模様。
静かな森の中で、みたいな描写のある会話後に生成したら右上みたいな子が出てきた。

【４：会話で指示して画像を出力させる】
さっきのって、LLMと会話して、指示して画像出させてる感じじゃないですよね。
なので、それをやろうかなと思って、でもふと思った。
別に今のままでも何も問題ないな、と。

以上、終了です。
画像認識もやらせてみようかとも思ったんですたまだやってない。
いつか気が向いたらやってみようと思います。

なんかこう、いろいろやりたいこと多すぎて時間が足りないです。