先日に続いて、Stable Diffusion(以下SD)のことについて記録していく。
AI画像生成では、もっぱら女性モデルの画像が人気を集めている。よく新技術は「戦争」→「エロ」の順で発展していくと言われているので、ある意味順当でもあるのかもしれない。
しかし自分の場合、AI画像生成でエロ画像を作りたいとは思っておらず、基本的にはブログや動画に使用する画像や、どうプロンプトをいじったらどのように変化するのかが興味がある。(エロに興味がないわけではないことは申し添えておきます)
AI画像生成で最も難しいと感じているのは、プロンプトと呼ばれる「画像を生成するための指示」であることは、一度でもAI画像を生成したことがある人ならご存知でしょう。
そして例に漏れず、自分もそこにだいぶ苦戦している。
さらに自分の場合、大相撲観戦が趣味でもあるため「力士」の画像を作ろうと思うのだが、データ数が少なすぎるのかニッチな分野なのか、とにかくうまく画像が作れない。
SDに限らずだが、AI画像生成は男性を描くのがかなり苦手に感じる。そもそも画像で男性を描こうとするのは、需要も少ないのだろう。
そこで今回は「モデルデータ」のダウンロードをして、それを反映して少しだけでも力士画像の生成に近づけられた内容をお伝えします。
まずSDにはモデルデータというものが存在していて、美少女系やイラスト系、劇画タッチなものなど、さまざまな元データが存在していて、無料でダウンロードできる。
各種モデルデータについてはこの辺のサイトを参照すると違いもわかって便利。
【2023年版】Stable Diffusion モデルまとめ
https://blogcake.net/stable-diffusion-models/
モデルデータの使い方は、それぞれのPC環境にもよるが、自分の場合はiMacでの使用なので、GoogleDriveの「MyDrive」にモデルデータを保存して、それをGoogleClaboでコピーする指示を書いている(コードは以下画像参照)。
さらに、モデルデータだけではなく「LoRAファイル」なるものもダウンロードしておくとかなり精度が高くなる。
この「LoRAファイル」とは、限定的なタイプの絵を描きたいときにプロンプトに追加することで、絵の精度を高めてくれるもの。
そして、これもモデルデータと同じように、GoogleDriveの「MyDrive」に保存して、それをGoogleClaboでコピーする指示を書く(コードは以下画像参照)。
すると、SDの作成画面上でダウンロードしたモデルとLoRAファイルが使用できるようになり、特定の画像が描きやすくなった。
もちろんまだまだデータ数が少ないせいか、色々修正箇所は散見されるが、イラスト系であれば力士の絵も描けるようになったことは嬉しかった。
最後に、AI画像生成というと、簡単に瞬間的に絵が描けると思われがちだが、少しずつプロンプトを修正したり、数値をいじっていると意外にも時間がかなりかかってしまう。
もちろん、上級者になれば簡単に好きな絵が描けるようになるのかもしれないが、最初のうちはトライエラーで時間をかけて努力するしかなさそう。
そのため上達するためには、エロ美女画像であろうと相撲イラストであろうと、自分の好きな絵をたくさん作成することが大切だと感じた。
SDの使用方法については自分もまだ模索中であるため、次回以降も記録としてまとめていこうと思います。