先週、上記のような衝撃のニュースが舞い込んできた。これまで、NovelAIやStable Diffusionなどがメインだったディフュージョンモデル生成は、新しいものがどんどん出てくるようになって久しい。
Google Colabで実現するAnythingというGeneratorはこれまでのモデルをまた隠すものとなっている。
これはそのAnythingによって生成された画像だが、見事なまでに人が書いたアニメ画像に近しいものになっている。
ディフュージョンにおいては「呪文」と通称されるシードフレーズが存在し、これによって画像の見た目が左右されるが、大体この呪文は長文になることが多かった。しかし、上記では非常に短い。
cute cat ear maid
それが呪文だ。
確かにcuteでcatなearでmaidであるが、たったこれだけの単語でここまでのクオリティになるのは凄いとしか言えなかったりする。
a top down view directly overhead
diagonal angle
high angle
などは人物の描写方向を指しており、それ以外にも1girlやcute anime girlなどを使えば日本風美少女アニメ風に仕上げることはできる。これは今までNovelAIが評価されてきたところをAnythingでもできる、ということを強調したいがための記述に過ぎない。
しかし、上記のような試行錯誤をする間、ときおり「sexy」や「adults」などのセンシティブワードを入れると下のような写真が出てきた。
これはどうやら、上記redditに載せたようにNSFWのフィルターに引っかかったようである。この解除法はいろいろあるもののGoogle ColabのStable Diffusionからtxt2imgパイソンファイルにて編集できるようである。
基本的な導入方法はインターネット上にあり、ここでは割愛する。