お久しぶりです。UGOKのぺぺ🍮です。
タイトルの通り今回は、世の中にたくさん存在している画像認識APIの中からいくつかをピックアップして試してみた!という内容のブログです。
画像認識というと……
画像の中から物体を検出したり、その物体について分析したり、画像内の文字を認識したり等々…… ざっくり言うとこんなことができちゃう技術のことです。
その技術をすぐに使えるように、様々な企業がAPIとして提供しています。今回私が試したものは基本無料のものばかりでした。
↓ 今回試したAPIたち ↓
① Microsoft Computer Vision
② Google Cloud Vision
③ Amazon AWS Rekognition
それぞれのAPIの特徴や公式サイトのデモを試してみた感想などなど、、ゆるく報告していきます💪
マクロソフト社が提供している画像認識APIです。公式サイトに画像をアップロードするだけで試すことができるデモがあります。
→ Microsoft Computer Visionのデモ
このAPIを試してみて一番感動したのが「画像から文章を生成する機能」です!
まずは、サンプルイメージとして用意されていた駅構内の写真を試してみました。
小さくて見えづらいですが、画像から読み取れた要素が単語として羅列しています。そして、それらの要素を元に "people waiting at a train station" という文章が生成されました!こんなにブレてる画像なのに正確!!!!!
次に、私が猫カフェに行った際に撮ったねこちゃんの写真を試してみました。
カメラで撮った写真って「IMG_6788.JPG」とかの意味をなさないタイトルばかりだから、こんな感じで写真にあったタイトルを自動でつけてくれたら検索とか管理が楽になりそうだなと思いました。
Google Cloud Platformが提供している画像認識APIです。Googleアカウントがあれば、こちらも画像をアップロードするだけで試すことができます。
点線で囲まれた部分に画像をドラッグ&ドロップすることで試すことができます。
今回はNintendo Switchの画像で試してみました。
ちゃんとゲーム機本体とコントローラーが区別されています!
任天堂のロゴも検出されました…… すごい……
デモを試す前に調べた情報によると「Google検索結果を用いて画像を分析する機能」があり、それが一番の特徴とのことだったのですが、私が試した時にはその機能を見つけることができませんでした…… すみません🙇♂️
ウェブ検出機能では、アニメイラストからキャラクター名を検出したり、家電の画像からその家電の製品名を検出したりすることができるそうです。流石Google先生。
Amazon社が提供している画像認識APIです。ただ、AWSというクラウドコンピューティングサービスへの登録が必要でした。住所やクレジットカード情報を入力しないといけないため少々面倒です。
このAPIは人物の顔分析に特化しているそうです。
まずは、サンプルイメージとして用意されていた写真を試してみました。
3人の人物それぞれの分析結果を見ることができます。
男性か女性かの判別は勿論、年齢まで分析してくれます。
驚いたのが、口角の上がり方・目や眉の形から笑顔かどうかの判別ができるという部分です。また、微妙な表情を読み取り、その人物の感情までもを分析してくれます!
また、「有名人の認識」という面白そうな機能が!!!
アイドルが好きな私、試しに某女性アイドルグループの方の写真を入れてみました!(画像ぼかしてます)
驚異の95%……
調子に乗った私、某男性アイドルグループの方の写真も試してみた。
でも私の推しの写真は認識されませんでした(なんで)
ローマ字表記だから日本人より外国人の方がよりヒットするのかな?
はい。ということで最後かなり脱線してしまいましたが……
今回いろいろな画像認識APIをサラッとですが試してみて、どのAPIもそれぞれ特化している部分を発見することができてとても面白かったです!
最後まで読んでくださってありがとうございました。