人気ブログランキング |

2019年 09月 20日 ( 1 )

オネーサンを探せ!


AIを使ってオネーサンを探すプロジェクトは新たなステージへ^^

スバル・レヴォーグのCMで人や物をリアルタイムで検出するのを見たことがあると思う。
「リアルタイム」な物体検出は大人の事情で無理なのが、静止画であれば
ゆっくりと処理すればいいので、それをやってみた。
先週はGoogleが開発したInception V3というAIモデルに転移学習(追加の学習)させ、
なんとなくのレベルまでたどり着いたが、今回はSSD(Single Shot MultiBox Detector
高速リアルタイム物体検出)というAIモデルを使った。
これもディープラーニング(深層学習)で、前回同様、すでに学習済みのAIモデルなので即戦力だ。
今回は時間のかかる学習もないので、GoogleのWeb環境は使わずにパソコンだけでやってみた。
10枚の写真を読ませると、15秒程度で結果を教えてくれる。
8割以上自信があるとされた物体の名前とその輪郭を表示させてある。
紫が「人」、緑が「ビン」だ。枠がないのは検出しなかったか8割以上の自信がない物体。
他の写真でも実験してみたが、後ろ向きのボケボケのオネーサンも
8割以上の自信で検出している。さすがのレベルだ。
この学習済みモデルは、他にも、車、バス、自転車、バイク、電車、ボート、飛行機、
人、猫、犬、牛、馬、羊、鳥、ソファー、テレビ、食卓、椅子、ビン、鉢植えが
識別できる。
ただ、GoogleのVision AI(月1000回以上は有償)は「女性」をある程度識別できるが
そこは無理。転移学習(追加の学習)をすれば、「オネーサン」を追加できる可能性はあるが、
適切な写真を大量に用意しないと、識別のレベルが下がってしまう可能性も大きい。

リアルタイムで人を検出して写真を撮るようにするためには、かなり高速な処理が必要で、
10万円程度のGPU(画像処理プロセッサー)では、1秒に1枚撮れるかどうか。
まあ自動車に搭載するわけではないので、数秒に1枚でも十分かもしれないが。



d0108132_21442834.jpg
d0108132_21442785.jpg
d0108132_21442812.jpg
d0108132_21442794.jpg
d0108132_21442731.jpg
d0108132_12003013.jpg

d0108132_21442717.jpg
d0108132_21442782.jpg
d0108132_21442795.jpg



こんなことばかりやっていてぜんぜん撮影に出かけていないので、近日中にネタが尽きる。
そうしたらしばらくお休みに入りますので、ご心配なく^^;









by tullyz1 | 2019-09-20 16:30 | Comments(10)