人気ブログランキング |

オネーサンを探せ!


AIを使ってオネーサンを探すプロジェクトは新たなステージへ^^

スバル・レヴォーグのCMで人や物をリアルタイムで検出するのを見たことがあると思う。
「リアルタイム」な物体検出は大人の事情で無理なのが、静止画であれば
ゆっくりと処理すればいいので、それをやってみた。
先週はGoogleが開発したInception V3というAIモデルに転移学習(追加の学習)させ、
なんとなくのレベルまでたどり着いたが、今回はSSD(Single Shot MultiBox Detector
高速リアルタイム物体検出)というAIモデルを使った。
これもディープラーニング(深層学習)で、前回同様、すでに学習済みのAIモデルなので即戦力だ。
今回は時間のかかる学習もないので、GoogleのWeb環境は使わずにパソコンだけでやってみた。
10枚の写真を読ませると、15秒程度で結果を教えてくれる。
8割以上自信があるとされた物体の名前とその輪郭を表示させてある。
紫が「人」、緑が「ビン」だ。枠がないのは検出しなかったか8割以上の自信がない物体。
他の写真でも実験してみたが、後ろ向きのボケボケのオネーサンも
8割以上の自信で検出している。さすがのレベルだ。
この学習済みモデルは、他にも、車、バス、自転車、バイク、電車、ボート、飛行機、
人、猫、犬、牛、馬、羊、鳥、ソファー、テレビ、食卓、椅子、ビン、鉢植えが
識別できる。
ただ、GoogleのVision AI(月1000回以上は有償)は「女性」をある程度識別できるが
そこは無理。転移学習(追加の学習)をすれば、「オネーサン」を追加できる可能性はあるが、
適切な写真を大量に用意しないと、識別のレベルが下がってしまう可能性も大きい。

リアルタイムで人を検出して写真を撮るようにするためには、かなり高速な処理が必要で、
10万円程度のGPU(画像処理プロセッサー)では、1秒に1枚撮れるかどうか。
まあ自動車に搭載するわけではないので、数秒に1枚でも十分かもしれないが。



d0108132_21442834.jpg
d0108132_21442785.jpg
d0108132_21442812.jpg
d0108132_21442794.jpg
d0108132_21442731.jpg
d0108132_12003013.jpg

d0108132_21442717.jpg
d0108132_21442782.jpg
d0108132_21442795.jpg



こんなことばかりやっていてぜんぜん撮影に出かけていないので、近日中にネタが尽きる。
そうしたらしばらくお休みに入りますので、ご心配なく^^;









by tullyz1 | 2019-09-20 16:30 | Comments(10)

Commented by voyagers-x at 2019-09-20 17:30
こんにちは ! !
すごいですね
正確に認識して判断していますね
もう近い将来、人間は機械に管理される社会ですね
九州の天気崩れてきました。
日曜日に子供の運動会ですけど、月曜日の朝判断してやるかどうか一斉にメールを送るとのこと
今雨降ってるのに、月曜日の朝グラウンドが使える状態になってると学校側は本当に考えてるのだろうか
その頭の悪さというか、対応の悪さに呆れます.......台風はこれからどんどん近づいてきて、天気はもっと悪化するのに

Commented by tullyz1 at 2019-09-20 22:55
>voyagers-xさん
今日は忙しかったようですね^^
なかなかのものですよね。パソコンに任せられるところは任せて、人間は楽をしたいものです^^
なんか、天気が崩れるみたいですね。こっちも明日明後日は雨みたいです。
しばらく降っていなかったので降って欲しいところですが。
中学でもまだ運動会があるのですね。全然記憶にありません^^ 
お役所仕事ということになるのでしょうか。先生たちも雑用で忙しくて
運動会どころじゃないんだといいたいところかもしれませんね^^
Commented by roxanne6 at 2019-09-20 22:59
いよいよ実証実験に入るのですね、すごいなぁ
おねーさん写真コレクターになれますね!どうせ見るんだったらおねーさんがいいわけでして
Commented by tullyz1 at 2019-09-20 23:15
>roxanne6さん
オネーサンだけを選び出すのはGoogleですら無理そうなので、「人」で妥協しようかと^^;
フレンチもデザートばかりでは物足りないでしょうから、これからも前菜やメインは出ます^^
これで「人」が入っている写真を選び出すことができることはわかったので、
次に考えているのは新しいターゲットを選び出せるかというテーマで、
ウォーリーを探せ!をやってみようかと。
早速、今日、飲み会の前に本屋で「ウォーリーを探せ!」を立ち読みしてきましたが、
結局見つけられず、まだ調査ができていません^^;
Commented by izumi-suzuki at 2019-09-20 23:38
AIも佳境に入ってきた感じですね。
今度のは凄いではないですか!! 人物はかなりの精度で検出していますね。
でも、不思議なのは「ビン」の方・・・検出された2本のビンと検出されなかった3本のビンの相違点が人間の私には理解できません。(笑) 真ん中のビンはピントもしっかり合っていて、ビン以外には見えないのに、AIはどこを識別してビンではないと思ったんでしょう? 85%に一体何が不足していたのかな?  すごい不思議。

でも、人でないものを誤って検出したり、ビン以外のものをビンと言わないところは素晴らしいです。
誤りを訂正するより、追加認識させていく方が容易なんですよね? だとしたら素晴らしい成果ですね。
Commented by minton at 2019-09-21 09:50 x
こんなことができちゃうんですね!!
びっくりです。
僕も作ってみたいけど畑違いで理解できません。
Commented by tullyz1 at 2019-09-21 17:18
>izumi-suzukiさん
オネーサンを識別するのがすべての基本ですから、一応、
ある程度の目途はついたかなという感じですね^^
ボケボケの女性の後ろ姿でも認識してますから、使えるレベルかと^^
ビンに限らず、2枚目のセンターのオネーサンは自信がないようで。
ボケてはいますが、後ろ姿でも識別するのに何故という感じです。
このように理由が説明できないのがAIの困ったところで、
逆に私に2枚目のセンターがどうしていいと思ったのかと尋ねられても
なんとなくとか、いいものはいいとしか言いようがないようなものかも^^
普通のプログラムなら2枚目のセンターを「人」と認識するように
修正できるのですが、AIはモデルを設計し直すか、データを換えて
学習し直して、結果をみてみるしかありません。ピンポイントで直すことが
できないのです。2枚目のセンターのいろんな写真を学習データに追加すれば
きっと次は間違えませんが、他のオネーサンを認識できなくなるかもしれません。
2枚目のセンターばかり気になって、他のオネーサンが目に入らなくなるわけです^^
どこで妥協するかですね。
Commented by tullyz1 at 2019-09-21 17:24
>mintonさん
なかなか面白いでしょ^^
暇を持て余しているので、最近はAIにハマっています^^
理論的にはなんとなくわかるものの、実際にAIがちゃんと識別できると
どうしてわかったのかなぁと不思議になります。
普通のプログラミングとは全然違うので最初は戸惑いましたが、
AIを使うだけなら結構簡単にできるんです。
Commented by Neoribates at 2019-09-22 11:17
へぇー,そういうものですか.
確かに,オネーサンの判断基準ってなんなんですかねぇ.そこが一番興味があります.もちろん膨大なデータを読み込ませての結果なんでしょうが,開発者にオネーサンとはなんぞや?と聞いてみたいでつ.
Commented by tullyz1 at 2019-09-22 15:25
>Neoribatesさん
オネーサンと言っているのは私なわけですが、写真に残したいと思える女性ででしょうかね^^
このSSDというモデルの開発者は「人」という範疇で写真を集めただけで、Googleは性別も入れて
写真にラベルを付けたわけです。SSDはリアルタイムで判別したいという目的もあり、余計なものは
排除したのでしょうね。人間であれば「人」だということはわかるボケボケの写真でも、
AIが何を特徴と判断して「人」だと結論付けたのかは摩訶不思議な感じはします。
2次元の情報があればまだ納得できなくもないですが、AIの教科書に出てくる手書き数字の判別という
例題では、画素を一列に並べ直して、それだけで判別するので本当に不思議です。
名前
URL
削除用パスワード

<< 東北の夏(33) 東北の夏(32) >>