テクノロジー

【AI】"画像生成"やってみた。

くっしー🐬's icon'
  • くっしー🐬
  • 2022/11/08 10:09

記事投稿日:2022/11/08

Content image
Stable Diffusion

最近は仕事が多忙というか空き時間や休暇中は回復するために休んだり映画見たりYouTube見たりが増えてきたのを感じつつ、自分の大学の頃や昔やってたこととかを振り返ってたら、そういえばALISやnoteに記事を投稿してたのをなんか思い出したくっしーです。

 

Content image
画像の自動生成した初音ミク

 

そんで、
ALISまだあったんだ。笑

 

個人的にはALISは「文字制限のないTwitter」みたいで好きだから嬉しいけど、

 

久しぶりにのぞいたら、

意外と「AI系の記事は少ないな」って思って。

ないなら、わいが書けばよろし。

 

と思ったので、書く!

 

そんで、

 

AIの"画像生成"やってみた。

Content image
和風なペガサスw

 

てか、
誰でもやれちゃうから、

 

わっちが、いろいろ画像生成試したから、

みんなも、AIで画像生成を試してみようぜ!

 

って感じで。笑

 

 

「AIの自動画像生成」ってだけでも、結構いろいろでたくさんあるけど、

1. サクッとできるぜ

2. コードたたいてできるぜ

3. 深堀りできるぜ

 

の3つの軸で紹介してこう。

ちょっと体系的な感じで。

 

 

Content image

1. サクッとできるぜ

・追記:にじジャーニー

Content image

貫く剣さん(@piercesword)に教えていただきました!

これもまたDiscordから生成できるみたいです。

midjourneyの雰囲気かつ生成はNovelAIよりも少しいい感じ?

Discordの招待が楽しみ✨

 

 

 

 

・mage space

Content image
mage.space

マジで中央のバーに打ち込んでエンター押すだけ。
めちゃくちゃ簡単。
こういうのを”プロンプト”呼んだりするんですが、ちょっとコツが必要で。

その辺りは「3. 深堀りできるぜ」でちょっと補足入れやす。

(一応「椅子を生成するプロンプト」だと、こういう違いが見れたりするよ。)

Content image
chair
Content image
chair, king,highly detailed,ultra detail,ray tracing,volumetric lighting,sharp focus,sharp details,strong shadows,crisp edges,professionally retouched,soft lighting,8 k high definition,elegant,intricate

ちなみに、同じプロンプトでも、毎度違う生成ができるから、そこも醍醐味っす。

 

 

 

 

・DreamStudio

Content image
DreamStudio

これはクレジット(要は無料で生成できる回数)に限りはあるみたいだけど、めちゃくちゃサクッと生成できちゃう。

「Stable Diffusion」って技術がちょくちょく出てくるんやけど、ここの会社がオープンにしたことで、一気に広まった感がある。
どこも閉ざしてたけど、AIお絵描きの業火を生み出したと言ってもほんとに過言じゃない。

 

あと、これもプロンプトの工夫は必要だけど、自分は侘び寂び系でこんなん生成したりした。

Content image
侘寂
Content image
WABISABI

めっちゃ風情感じるんやがw

ちゃんと雰囲気もクオリティ感もあってめっちゃ好き。

 

 

 

・Pixray

Content image
Pixray

 

これは”ピクセルアート”とかを生成できる優れもの。
さっきまでのとは打って変わって、可愛い感じのドット絵的なのが生成できる。
これに関しては、そこまでプロンプト意識しなくても、ドット絵にしたいものを打ち込んだらそれなりにピクセルアートにしてくれる。

 

これがわっちが以前に生成したピクセルアートの記事のやつ。

参考までに👼

Content image
Angel in heaven

 

 

 

・Canvas

Content image
Text to image(Beta)

Canvasは、ポスターとかフライヤーみたいなのをサクッとデザインできるアプリケーションやったと思うんやけど、ベータ版で画像生成の機能が追加されてた。

他のに比べて数が少なかったり、生成に特化してる感じではなさそうやけど、それでもこういうアプリに組み込まれているんはコモディティ化してる技術やなって実感するし、すごいことやと思う。

 

 

 

・midjourney

Content image
midjourney

これはまた凄くて、なんとDiscordで生成できてしまう。

すごすぎる。わけわからん。

Content image
美しい。。。

 

ここの記事で、わかりやすく使い方が解説されてる。

ざっくりまとめると、

1. Discordのチャンネルに入る

2,「#newbies-145」みたいなチャンネルから一つ選んで入る

3,「/imagine」を入力したら出てくる「prompt」を選択して進めてく。

でできる。

 

 

 

・DALL-E

Content image
Content image
初音ミク

 

こちらも生成がサクッとできちゃう。

かわいい初音ミクも生成してみた。

 

すご

 

 

 

 

 

 

 

・NVIDIA AI

こちら、デモ動画。

これはちょっと難易度上がるけど、それなりに環境があったり、デモ動画見て頑張る根気があれば誰でもできちゃう優れもの。すごい時代よほんと。

今までのテキストから生成するのに加えて、ペンでかき入れたとこを雲にしたり海や山にしたり。まさに自然を構築する神の如く作れちゃう。

 

 

 

・NovelAI

Content image

txt2imgという機能が追加されたらしい。

どちらかというと、サブカルチャー的な生成が得意そうな印象。

クレジットも無料だと5回っぽい。

 

 

 

・お絵描きばりぐっどくん(LINE)

Content image
Content image

 

なんと、LINEで画像生成できちゃう。

しかも、日本語でできちゃう。

英語アレルギー並みに苦手意識のある人とかには特にとっつきやすいのかも。

 

「サラダチキン」なんかも、
サクッと生成できちゃう。
できちゃう。ん?

 

 

 

 

Content image

 

 

2. コードたたいてできるぜ

”Colab”でできる!

ColabっていうGoogleが提供してるウェブ上でできちゃうエディタなんだけど、クラウドでpythonの実行までできちゃう優れものの中の優れもの。

 

・Neural Style Transfer with Eager Execution

Content image
Neural Style Transfer with Eager Execution

これはさっきまでとは打って変わって、テキストから生成ではなく、
「素材となる画像」に「スタイル画像」をぶち込んで生成する。
たとえば、ゴッホ風の絵にする、みたいなこともできるやつ。

Content image
サグラダファミリア。良すぎ。

こんなんもできる。す、すばらしい。

 

 

 

・Big Sleep

Content image
BigSleep(Github)

こいつはテキストから生成したりするやつ。

正直手法はそれぞれだと思うから絶対この処理をしてるとは言えないけど、
どんなコードになってんだこのやろう、ってのは見れるよ。
OpenAIのBigGANとかもろもろの技術が使われてるらしい。

 

 

 

・BigGAN TF Hub Demo

Content image
モーフィング動画作れる

モーフィング動画が作れる。

パンからバスに、学校に、アヒルに、と変わってくようなやつ。

人によっては、違和感が苦手な人がいるかも。

 

 

 

・Style Transfer

Content image
スタイル転送

これも、なんとか風、とかにできるやつ。

スタイル転送って技術を使っている模様。

Content image

ゴッホ風にもできちゃう、ってわけだ。

 

 

 

Content image

3. 深堀りできるぜ

★プロンプト

”プロンプト”という呪文が大事になってくる。
プロンプト:画像錬成の方向性ベクトルを定めるもの

この、深津さんの記事はすごい参考になるので、ぜひ読んでみてほしい。

AIをよく使役するには、2つの理解
「ベクトルの方向を強く適宜する力ある言葉ルーンの語彙力」と
「再現性をもった呪文の組み立て」が必要になる。

 

 

 

・MakeitTalk

音声から画像を動かす

おもろい。

 

 

・First Order Motion Model for Image Animation

Content image
First Order Motion Model for Image Animation(GitHub)

顔トラッキングしてしゃべらせるなど。

ほんとすごいよねこれ。フェイクなんたら系の最たる例だけど。

でもさ、生き別れた人ともう一度話せる技術でもあるんだよね。

他にも、アニメーターの労力減らしてみたり。

技術は使い用よな。悪用は見逃せんけども。
 

 

・OpenAI

Content image
DALL·E

DALL·E Images API がパブリック ベータ版で利用できるようになりました。

だそうです👍

最高か?w

 

 

・Phenaki

Content image
Phenaki

画像生成では飽き足らず、動画生成し始めてたんやけど。

えぐ。w
えぐい。w

 

 

・Imagen Video

Content image
imagen Video

やはり、動画生成しとる。
すごいなほんま。

 

 

 

・Make A Video

Content image

いや、

どんだけ動画生成したいねん。ww

どこも取り組んでるんやなこのAI技術。
まだ実利主義というよりはイノベーター感はあるけど、

だからこそおもしろいよな。

その場しのぎのつなぎとかで、生成させて流しとくとかできたり。
CMは自動生成させとけばわざわざ作らんでよかったり。
いろんなゲーム実況を学習させて投稿したり。

やっぱり、技術は止まらない。

 

 

 

 

 

Content image

 

 

あとがき

裏の学習モデル教師データや、それらを動かすアルゴリズムあってこそ。

 

他にもまだまだあるし、これからどんどん出てくるけど、
ちょっと書く気力がないので、投げやりです。
許してください。許してちょ。ごめんなさい許してください。

 

正直、AIで生成している僕らは、アーティストやクリエイターというよりは、
「クライアント寄りのディレクター」
だと思ってる。
これにおいてのアーティストやクリエイターは
「アルゴリズムを構築したエンジニア」と
「学習素材となった教師データを作ってきた作家たち」
だと思う。
あくまで僕らはプロンプトという名の依頼をしていて、AIに受注している。
そんな感覚がある。

強いていうなら、プロンプトデザイナーみたいな、どんなプロンプトがより良い生成につながるか、という目線。
でも、それはおそらく「アルゴリズムを構築したエンジニア」が詳しいけど。笑

だけど、その中で唯一残された立ち位置が、
「何を生成したいのか」「どういう方向性がいいのか」という部分。
すでに用意はされているから、あとは何をしたいのか。
この部分だけは、まだ残されている。

この世は出る杭は打たれると言いつつも、
好きをぶっちぎることも大事なんよな。
実際は、需要だけど。

前に「昭和の頃はあった仕事」みたいなの調べてて、
たとえば、ミルクホールっていう牛乳やパンなどの喫茶店みたいなものは、
カフェーってものに市場を奪われたり、
人力車とかは、交通手段としては無くなったけど風情を感じるものとしては
まだ仕事として残ってたり。
他にも腹話術など職業や仕事というよりは伝統芸能化したものだったり。

AIが仕事をうんたらかんたらというよりも、
その延長線上は何か。

 

なんか、お腹すいた。

 

 

□■TODAY IS A GOOD DAY FOR YOU■□

 

 

 

 

 

 

 

 

 

 

 

Supporter profile iconSupporter profile iconSupporter profile iconSupporter profile icon Supporters link icon
Article tip 8人がサポートしています
獲得ALIS: Article like 308.57 ALIS Article tip 120.32 ALIS
くっしー🐬's icon'
  • くっしー🐬
  • @kusshi
くっしーです!!!

投稿者の人気記事
コメントする
コメントする
こちらもおすすめ!
Eye catch
テクノロジー

iOS15 配信開始!!

Like token Tip token
7.20 ALIS
Eye catch
他カテゴリ

機械学習を体験してみよう!(難易度低)

Like token Tip token
124.82 ALIS
Eye catch
ゲーム

ドラクエで学ぶオーバフロー

Like token Tip token
30.10 ALIS
Eye catch
クリプト

Uniswap v3を完全に理解した

Like token Tip token
18.92 ALIS
Eye catch
他カテゴリ

ALISのシステム概観

Like token Tip token
5.00 ALIS
Eye catch
テクノロジー

オープンソースプロジェクトに参加して自己肯定感を高める

Like token Tip token
85.05 ALIS
Eye catch
クリプト

Bitcoin史 〜0.00076ドルから6万ドルへの歩み〜

Like token Tip token
947.13 ALIS
Eye catch
クリプト

17万円のPCでTwitterやってるのはもったいないのでETHマイニングを始めた話

Like token Tip token
46.60 ALIS
Eye catch
テクノロジー

なぜ、素人エンジニアの私が60日間でブロックチェーンゲームを制作できたのか、について語ってみた

Like token Tip token
270.93 ALIS
Eye catch
クリプト

NFT解体新書・デジタルデータをNFTで販売するときのすべて【実証実験・共有レポート】

Like token Tip token
120.79 ALIS
Eye catch
テクノロジー

彼女でも分かるように解説:ディープフェイク

Like token Tip token
32.10 ALIS
Eye catch
クリプト

ブロックチェーンの51%攻撃ってなに

Like token Tip token
0.00 ALIS