【AI】"画像生成"やってみた。

くっしー🐬
2022/11/08 10:09

記事投稿日：2022/11/08

最近は仕事が多忙というか空き時間や休暇中は回復するために休んだり映画見たりYouTube見たりが増えてきたのを感じつつ、自分の大学の頃や昔やってたこととかを振り返ってたら、そういえばALISやnoteに記事を投稿してたのをなんか思い出したくっしーです。

そんで、
ALISまだあったんだ。笑

個人的にはALISは「文字制限のないTwitter」みたいで好きだから嬉しいけど、

久しぶりにのぞいたら、

意外と「AI系の記事は少ないな」って思って。

ないなら、わいが書けばよろし。

と思ったので、書く！

そんで、

AIの"画像生成"やってみた。

てか、
誰でもやれちゃうから、

わっちが、いろいろ画像生成試したから、

みんなも、AIで画像生成を試してみようぜ！

って感じで。笑

「AIの自動画像生成」ってだけでも、結構いろいろでたくさんあるけど、

1. サクッとできるぜ
2. コードたたいてできるぜ
3. 深堀りできるぜ

の3つの軸で紹介してこう。

ちょっと体系的な感じで。

1. サクッとできるぜ

・追記：にじジャーニー

貫く剣さん（@piercesword）に教えていただきました！

これもまたDiscordから生成できるみたいです。

midjourneyの雰囲気かつ生成はNovelAIよりも少しいい感じ？

Discordの招待が楽しみ✨

・mage space

マジで中央のバーに打ち込んでエンター押すだけ。
めちゃくちゃ簡単。
こういうのを”プロンプト”呼んだりするんですが、ちょっとコツが必要で。

その辺りは「3. 深堀りできるぜ」でちょっと補足入れやす。

（一応「椅子を生成するプロンプト」だと、こういう違いが見れたりするよ。）

ちなみに、同じプロンプトでも、毎度違う生成ができるから、そこも醍醐味っす。

・DreamStudio

これはクレジット（要は無料で生成できる回数）に限りはあるみたいだけど、めちゃくちゃサクッと生成できちゃう。

「Stable Diffusion」って技術がちょくちょく出てくるんやけど、ここの会社がオープンにしたことで、一気に広まった感がある。
どこも閉ざしてたけど、AIお絵描きの業火を生み出したと言ってもほんとに過言じゃない。

あと、これもプロンプトの工夫は必要だけど、自分は侘び寂び系でこんなん生成したりした。

めっちゃ風情感じるんやがw

ちゃんと雰囲気もクオリティ感もあってめっちゃ好き。

・Pixray

これは”ピクセルアート”とかを生成できる優れもの。
さっきまでのとは打って変わって、可愛い感じのドット絵的なのが生成できる。
これに関しては、そこまでプロンプト意識しなくても、ドット絵にしたいものを打ち込んだらそれなりにピクセルアートにしてくれる。

これがわっちが以前に生成したピクセルアートの記事のやつ。

参考までに👼

・Canvas

Canvasは、ポスターとかフライヤーみたいなのをサクッとデザインできるアプリケーションやったと思うんやけど、ベータ版で画像生成の機能が追加されてた。

他のに比べて数が少なかったり、生成に特化してる感じではなさそうやけど、それでもこういうアプリに組み込まれているんはコモディティ化してる技術やなって実感するし、すごいことやと思う。

・midjourney

これはまた凄くて、なんとDiscordで生成できてしまう。

すごすぎる。わけわからん。

ここの記事で、わかりやすく使い方が解説されてる。

ざっくりまとめると、

１. Discordのチャンネルに入る

２,「#newbies-145」みたいなチャンネルから一つ選んで入る

３,「/imagine」を入力したら出てくる「prompt」を選択して進めてく。

でできる。

・DALL-E

こちらも生成がサクッとできちゃう。

かわいい初音ミクも生成してみた。

すご

・NVIDIA AI

こちら、デモ動画。

これはちょっと難易度上がるけど、それなりに環境があったり、デモ動画見て頑張る根気があれば誰でもできちゃう優れもの。すごい時代よほんと。

今までのテキストから生成するのに加えて、ペンでかき入れたとこを雲にしたり海や山にしたり。まさに自然を構築する神の如く作れちゃう。

・NovelAI

txt2imgという機能が追加されたらしい。

どちらかというと、サブカルチャー的な生成が得意そうな印象。

クレジットも無料だと5回っぽい。

・お絵描きばりぐっどくん（LINE）

なんと、LINEで画像生成できちゃう。

しかも、日本語でできちゃう。

英語アレルギー並みに苦手意識のある人とかには特にとっつきやすいのかも。

「サラダチキン」なんかも、
サクッと生成できちゃう。
できちゃう。ん？

2. コードたたいてできるぜ

”Colab”でできる！

ColabっていうGoogleが提供してるウェブ上でできちゃうエディタなんだけど、クラウドでpythonの実行までできちゃう優れものの中の優れもの。

・Neural Style Transfer with Eager Execution

これはさっきまでとは打って変わって、テキストから生成ではなく、
「素材となる画像」に「スタイル画像」をぶち込んで生成する。
たとえば、ゴッホ風の絵にする、みたいなこともできるやつ。

こんなんもできる。す、すばらしい。

・Big Sleep

こいつはテキストから生成したりするやつ。

正直手法はそれぞれだと思うから絶対この処理をしてるとは言えないけど、
どんなコードになってんだこのやろう、ってのは見れるよ。
OpenAIのBigGANとかもろもろの技術が使われてるらしい。

・BigGAN TF Hub Demo

モーフィング動画が作れる。

パンからバスに、学校に、アヒルに、と変わってくようなやつ。

人によっては、違和感が苦手な人がいるかも。

・Style Transfer

これも、なんとか風、とかにできるやつ。

スタイル転送って技術を使っている模様。

ゴッホ風にもできちゃう、ってわけだ。

3. 深堀りできるぜ

★プロンプト

”プロンプト”という呪文が大事になってくる。
プロンプト：画像錬成の方向性ベクトルを定めるもの

この、深津さんの記事はすごい参考になるので、ぜひ読んでみてほしい。

AIをよく使役するには、2つの理解
「ベクトルの方向を強く適宜する力ある言葉ルーンの語彙力」と
「再現性をもった呪文の組み立て」が必要になる。

・MakeitTalk

音声から画像を動かす

おもろい。

・First Order Motion Model for Image Animation

顔トラッキングしてしゃべらせるなど。

ほんとすごいよねこれ。フェイクなんたら系の最たる例だけど。

でもさ、生き別れた人ともう一度話せる技術でもあるんだよね。

他にも、アニメーターの労力減らしてみたり。

技術は使い用よな。悪用は見逃せんけども。

・OpenAI

DALL·E Images API がパブリックベータ版で利用できるようになりました。

だそうです👍

最高か？w

・Phenaki

画像生成では飽き足らず、動画生成し始めてたんやけど。

えぐ。w
えぐい。w

・Imagen Video

やはり、動画生成しとる。
すごいなほんま。

・Make A Video

いや、

どんだけ動画生成したいねん。ww

どこも取り組んでるんやなこのAI技術。
まだ実利主義というよりはイノベーター感はあるけど、

だからこそおもしろいよな。

その場しのぎのつなぎとかで、生成させて流しとくとかできたり。
CMは自動生成させとけばわざわざ作らんでよかったり。
いろんなゲーム実況を学習させて投稿したり。

やっぱり、技術は止まらない。

あとがき

裏の学習モデル教師データや、それらを動かすアルゴリズムあってこそ。

他にもまだまだあるし、これからどんどん出てくるけど、
ちょっと書く気力がないので、投げやりです。
許してください。許してちょ。ごめんなさい許してください。

正直、AIで生成している僕らは、アーティストやクリエイターというよりは、
「クライアント寄りのディレクター」
だと思ってる。
これにおいてのアーティストやクリエイターは
「アルゴリズムを構築したエンジニア」と
「学習素材となった教師データを作ってきた作家たち」
だと思う。
あくまで僕らはプロンプトという名の依頼をしていて、AIに受注している。
そんな感覚がある。

強いていうなら、プロンプトデザイナーみたいな、どんなプロンプトがより良い生成につながるか、という目線。
でも、それはおそらく「アルゴリズムを構築したエンジニア」が詳しいけど。笑

だけど、その中で唯一残された立ち位置が、
「何を生成したいのか」「どういう方向性がいいのか」という部分。
すでに用意はされているから、あとは何をしたいのか。
この部分だけは、まだ残されている。

この世は出る杭は打たれると言いつつも、
好きをぶっちぎることも大事なんよな。
実際は、需要だけど。

前に「昭和の頃はあった仕事」みたいなの調べてて、
たとえば、ミルクホールっていう牛乳やパンなどの喫茶店みたいなものは、
カフェーってものに市場を奪われたり、
人力車とかは、交通手段としては無くなったけど風情を感じるものとしては
まだ仕事として残ってたり。
他にも腹話術など職業や仕事というよりは伝統芸能化したものだったり。

AIが仕事をうんたらかんたらというよりも、
その延長線上は何か。

なんか、お腹すいた。

□■TODAY IS A GOOD DAY FOR YOU■□