JetsonシリーズはNVIDIA社のマイコンで、GPUがあるのでAIのエッジデバイスとなります。NanoはJetsonシリーズの中で本稿執筆時点で一番小さいものです。
視覚障碍者にいろいろインタビューしました。目が見えない彼・彼女らは音声を頼りにしています。音声パソコンとか音声メールとか、徐々にですが音声で入出力ができるツールが出てきているそうです。筆者はインタビューの結果初めて知ったのですが、点字は視覚障碍者の10人に1人も理解しないそうです。一般的に障碍は先天性と後天性のものがあり、生まれつき目が見えない人は点字を勉強しますが、後天性の人にとって点字は難しくてできないそうです。
YOLOというAIプラットフォームがあります。これは人や車といった物体を動画・静止画から高いリアルタイム性をもって認識するコンピュータプログラムです。これを使って、物体を認識したら「人、2。車」などと発声する機器を作られれば視覚障碍者の役に立つのではと思い、開発しました。残念ながら、開発はうまくいきませんでした。
•プログラムはできた
•Nanoでは、YOLOv3 tinyモデルを動作させることができた
•標準モデルはメモリ不足で動作しなかった
•電源の問題が解決できなかった
•モバイルバッテリーでは電圧が足りず停止してしまう
•ハードウェアのプロに聞いても、電源問題は難しく解決できなかった
•小型WindowsノートPC(GPD WINやiiyamaのノート) ならできるか調査した
•プログラム自体は動いた。バッテリも問題なかった
•静止画は処理できたが、動画は処理できなかった
•まともなGPUがないと、動作不可能だとわかった。ゲーミングノートなら動かせるかも。ただ持ち歩きはできなくなる
•スマホ用アプリなら、クラウド側で物体認識させることは可能。執筆時点で「iDetection」というスマホアプリが物体認識できる。ただ、リアルタイム性は大きく低下する。5G になれば改善するかも
•エッジ側で物体認識するなら、ハードがもっと進化しないと持ち歩けてかつ良い認識精度を出せない
•あと4~5年で、視覚障碍者が持ち歩けるようになるかもしれない
以上