文字を入力するとその意味を理解し
自動で動画を作ってくれる「Sora」
と言うAI技術が発表されて
全世界でとても話題になってます
文章から動画を作るAIが普及すれば
YouTubeで特別な知識や技術なしに
ハイクオリティの作品を簡単に
制作できるようになります。
これを作ったOpenAIがSoraについて
「まるで魔法のようにテキストから
動画を生み出すAIで初の文字から
動画を作る物です」と言います。
作れる動画の長さが60秒まで可能で
細部までこだわり抜かれたシーン
カメラワークの鮮やかな動き
感情豊かなキャラたちを生みます
今迄のAIだと質が悪くて動画と言えず
それを考えると動画の長さはもちろん
その質においてSoraがこれまでのAIを
圧倒しています。
更に複数キャラや特定のモーション
物や背景の細部まで人が命令した
文字を分析してそれらが現実世界で
どんな風に存在するかまで理解します
質の高い動画を作り出すためには
多くの時間や資材が必要でしたが
今後高度な動画を自分1人で作れる
新時代が来るかもしれません。
〓=〓=〓=〓=〓=〓=〓=〓=〓
このAIが文字から動画を作る方法が
最初モニターをキャンパスとした時
そこに無数の色の絵の具を適当に
たくさん出してまき散らします
次に指示された場面の動きを
キャンパスにまかれた絵の具を使い
動画として動かしながら絵を作り
特殊な処理で完成させます
なのでこのIAが取ってる方法は
文字の意味を理解しながら
まかれた絵の具で動画を作る
同時作業を行ってるのです
AIを動かす機械を作ったNVIDIAの
ジムファン氏がXで「Soraが世界を
実験場にできるデータ駆動型の
物理エンジンであると賞賛しました
「データ駆動型の物理エンジン」は
実際の世界の物理法則を基にして
この世の全てをPC上に作れる
ソフトの一種です
今迄のPC上で世界を作るソフトは
人がプログラムを作っていたのに対し
データ駆動型はネットの膨大な情報を
常に学習し続けてるソフトです。
この方法は実世界の観測された現象を
ネットで常に収集し続けてるから
今までのプログラム入力の方法より
物理現象を更に正確に再現できます
〓=〓=〓=〓=〓=〓=〓=〓=〓
Soraにも苦手な事が多数存在し
動きが複雑だと全部理解できず
上手く再現する事が出来なかったり
まだまだ完璧じゃありません。
更にある目的の為に動いたのに
その目的を理解できず結果が
目的を達成した結果にならずに
へんてこな結果になったりします
例えばお菓子をかじった後
その食べた跡が反映されないとか
歩いている人間の左右の足の位置が
入れ替わったりとかあります
他にも椅子が空中に浮かんだり
物の動きの説明や視点の動き方など
時間で変化する事の説明を誤って
解釈する時があるようです
しかしこのままAIを進化させ行くと
本物と偽物が全く区別不能な
偽物の動画が作られて世界中の人が
その動画に騙されてしまいます。
でもSoraを安全に利用できるように
OpenAI社が安全対策をしてて
偽物を見抜為にレッドチームと言う
専門の技術者を編成しました。
このチームが偽物か本物か見分ける
信頼性が高いソフトを作るそうで
これが完成して一般に配られれば
悪意ある偽物の製作を止められます