人気ブログランキング |

タグ:AI ( 25 ) タグの人気記事

まつもと街なか大道芸2019(5)






d0108132_01212178.jpg




大駱駝艦
-------------



ブログの記事を書くのに音声入力が使えないかと試してみた。
Windows の標準機能を使ってみたが、誤認識ばかりで全然使えない。
Google のChromeでDocumentアプリを使うとGoogleの音声入力が使えるというので試してみた。
こちらは Androidスマホ同様にほぼ完璧に認識する。AIを使っているかどうかの違いが大きい。
普通の速度で話しても全然大丈夫。
音声データをGoogleのサーバーに送るのでプライバシーが微妙な感じがしないではないが、
用途を限定して使えば大丈夫だろう。


【今日のAI】
皆さんはもう飽きたと思うが、ボールをキャッチするAIはまだ続いている。
上下左右24ドットに再挑戦したが、前回のままのAIのモデルでは
3000回学習しても成功率が30%にしかならなかったのだ。
そこで成功率を上げるためにConv2D層を追加した。
それによって何とか90%の成功率を実現。
繰り返すが、パドルをどう動かすかはプログラムしてない。画面の状態を見て、
得点を貰えるようにパドルが右・左・止まるを決めているのだ。
d0108132_18334431.gif



















.

by tullyz1 | 2019-10-26 09:15 | Comments(4)

まつもと街なか大道芸2019(4)







d0108132_01200370.jpg

遠くから見ていたら強制的にここに座らされたカップル。


SUKE3&SYU
-----------



【今日のAI ~ Q学習その2】
昨日の「落ちてくるボールをキャッチする」だけのAIだと画的に地味なので
どこがAIなんだと思われた向きもあるかもしれないと反省して
ボールに動きを加えて難易度を上げてみた。

10回学習したレベル。見逃しばかりで全く動けていない。ボールを怖がっている。

d0108132_00381554.gif











1000回学習したレベル。完璧にボールに食いついていけている。メンタルもかなり鍛えられた。
1000本ノックはAIにも効果があるということが実証された。
d0108132_00391960.gif















.


by tullyz1 | 2019-10-25 09:37 | Comments(2)

まつもと街なか大道芸2019(3)







d0108132_01192112.jpg





--------------



【今日のAI ~ Q学習】
今日のAIは「落ちてくるボールをキャッチする」というもの。
上下左右に8マスの空間があり、どこかから落ちてくるボールを、一番下で左右に動きながら
キャッチするだけ。うまく取れたらご褒美をあげるという学習を繰り返す。
普通のプログラムでは、籠をどう動かすかをプログラマーが教えないといけないのだが、
AIは、仕事の目的をボーナスという形で教えてあげると、それを貰うために何をすべきかを
自分で考えるところがエライところ。会社のみんなに聞かせてあげたいな。

Q学習といわれるジャンルの例題で、将棋やチェスなどで人間をことごとく負かすタイプのAIだ。
将棋やチェスなんてできるはずもないので、例題をやって原理的なところを理解する。
例題をやるだけの話なのだが、それが難しい。3,4年前のWebの記事なので
今とはソフトウェアのバージョンがかなり違い、仕様が変わっている。
それを書き直さないとエラーではじかれて先に進めない。ロールプレイングゲームの
かなり厄介な奴。知識と経験値と試行錯誤^^;を使って、今回は3つくらいの敵を倒し、
ようやく動いた。


10回くらいの学習だと成功率20%で、幼稚園児のキャッチボール並み。
ボールをキャッチする直前に逆に動いたりするorz
50回も学習すると成功率60%で、小学校低学年並みになる。多少こざかしくなってきて
じっと立っていて無駄な動きをしない。うまく取れる時もあれば、間に合わずに外すこともある。
100回で80%、300回で100%。こうなるとほとんど高校野球以上で
フライに合わせて左右に動きながら確実にキャッチする。
上下左右に12マスの空間だと300回学習しても80%。
上下左右に24マスの空間だと1000回学習しても20%。格段に難しくなってくる。
リアルな世界で投げたごみをキャッチする機械をつくるなら、AIではなくて
別の方法でゴミを検出してキャッチする方が早そうだ。

80コマをループさせてます
d0108132_14541002.gif





















.

by tullyz1 | 2019-10-24 16:19 | Comments(2)

多治見市モザイクタイルミュージアム

豊田市は他に行くところが無いので、多治見に移動。
多治見市モザイクタイルミュージアム。
藤森照信の設計なので、近江八幡のクラブハリエ(バウムクーヘンのお店)の
ラコリーナみたいな建物だ。
平日にもかかわらず若い人が沢山いた。






d0108132_14451656.jpg






-------------




今週のAIではいよいよ「ウォーリーを探せ」をやってみた。
ウォーリーをやる際の問題は、実際のウォーリーの画像が少なすぎること。
仕方がないので、実際の画像ではなくて広告などに使われているキャラクターの絵を使った。
キャラクターの絵は実際のウォーリーとは違うので、無理なんだろうとは思ったが
24枚の画像で9枚は見つけてくれた。自信のほどは6-7割というところ。
次に実際のウォーリーの画像を使ってデータを作ったが、数が少ないだけでなく、
ウォーリーの画が小さすぎる。特徴が抽出できないので、判別させてみたらほぼ全滅。
拡大してスキャンもできる印刷の網点が見えてしまって、学習用の画像としては使えない。
2つ目の問題は「ウォーリーを探せ」はたくさんのものが複雑に入り組んでいるので
対象の切り出しがうまく働いていないこと。切り出してから、ウォーリーかどうか判断するので
最初のステージがうまくいかないと、その先は無い。
3つ目の問題はメモリー容量の壁。複雑な「ウォーリーを探せ」をきれいにスキャンするためには
1ページあたり900万画素必要だが、グラフィックプロセッサーがメモリー不足と仰せ。
モノクロにしたり解像度を下げると検出力も落ちる。
ということで、とりあえず終了。
「ウォーリーを探せ」はまたいつか挑戦してみたいテーマだ。









.

by tullyz1 | 2019-10-21 16:48 | Comments(2)

多治見修道院(1)

カトリックの修道院。ここではワインを製造している。クッキーもあるらしい。
北海道のトラピスト修道院のクッキーは有名だ。
残念ながら公開は4時までで、中に入ることはできなかった。






d0108132_14490645.jpg





------------




【今日のAI】
カエルを認識できるようにした(はずの)AIの試験結果。
3時間も学習したのに10枚の写真でカエルだと認識したのは1枚だけorz
しかも自信の度合いは64%と低い。
人やボトルなどの他の対象も学習したので、カエルまで手が回らなかったのかもしれない。
他の対象でもだいぶ認識率は低くなって、軽度認知障害(MCI)が認められるorz

仕方がないので短期集中講座でカエルだけを学習することにした。
カエルの写真の枚数も百数十まで、3倍に増やした。
アマガエルやトノサマガエル、ヒキガエルはもちろん、ネットから拾ってきた都合上
青いカエル、赤いカエルなど奇抜なものも多くて、これでいいのかと疑問に思いながら
画像の前処理を進めた。
そして、5分ほど真剣に学習。
その結果、おおむね90%以上の自信をもって全問正解するまでにAIは成長した^^
草むらに隠れているアマガエルでも5割くらいは探せた。
これでカエルを自動で捕まえる装置の開発に一歩近づいた。
姉妹品としてイナゴを自動で捕まえる装置もできそう。バッタ除外機能付きだ^^








.


by tullyz1 | 2019-10-16 16:49 | Comments(6)

クリムト展(3)








d0108132_14441026.jpg







d0108132_14441401.jpg





豊田市美術館
-------------




昨日は台風一過でいい天気だったのに、今日は朝から雨。
雨の日はAIのお勉強。

【今日のAI】
今のテーマはシャア専用(3倍速い)YOLOv3に学習させるというもの。
AIの学習ってどれもそうなのだが、学習させるデータを用意すのがまず一苦労。
前回SSDで用意したカエルのデータを流用したのだが、不足分があったのでそれを追加。
基本的には用意されているスクリプトを動かすだけのはずなのだが、
そうは問屋が卸さない。エラーが出て止まるorz
そのエラーの原因を探して対策を打っていく必要がある。
動くことを確認して公開しているはずなのに動かないとなるとかなり厄介だ。
スクリプトを動かす環境は文字通り日進月歩なので、それによって動かなくなる可能性は大きい。
また、WindowsかLinuxかで微妙に挙動が異なることもある。
動作が確認されているスクリプトなので、それを素人が疑うというのは
かなり大変だ。今回は「フォルダーかファイルが見つかりません」というエラーで
あらゆる可能性を考えてデータを変更する試行錯誤をしたのだが、結局はスクリプトを
書き換えたら直った。それでいいとする自信はないが、動けば正解。
他にも小さな問題は数点あって、ここまでに1日半かかった。
「機械学習」というのは機械が学習するということのはずなのだが
現実は私が機械に学習させられている状況だ^^;

とりあえずエラーは出なくなったので学習を始めた。
1回あたり16枚の写真を学習し、それを50回繰り返す。
先日買った画像処理プロセッサー(GPU)GTX1060を使っているが
それでも3時間くらいかかる。GPUがなかったら30時間以上か^^;











.

by tullyz1 | 2019-10-15 16:44 | Comments(6)

信州・渋温泉2005(10)






d0108132_11152354.jpg




おしまい

-----------



【今日のAI】
今日のAIは、これまで遊んできたSSDというモデルより3倍速くて正確というYOLOv3。
作った人はスキンヘッドに長いひげというかなり怪しい人なのだが、
たぶん相当賢い人だ。詳しいことはまるで分らないが、SSDと同じ画像で試してみたところ、
SSDで検出できていなかった被写体ブレのオネーサンをちゃんと検出していたり、
小さい子どもや人もちゃんと認識できたりする。
「ウォーリーを探せ!」をやるには、このくらいの性能が無いと難しそうだ。
YOLOv3は標準で識別できる物体がSSDの20種類に比べて80種類もあるので、
ぼかしたオネーサンを検出するだけでなく、ハンドバックを持っていて、
手前にはカップがあるというところまで分かる。
残念ながら猿は標準で識別できないので、熊とか鳥か犬といわれてしまうのだが^^
高速なので、動画ファイル(mp4やビデオカメラ)を読ませると、
リアルタイムで位置と物体の種類を表示できる。

YOLOv3は2018年の4月に論文が出された、まだ1年ちょっとしか経っていない技術だ。
これで驚いていたら、さらに速くて正確なM2Detというモデルもあるようで、
最新の情報は論文を読まないとわからない。
物体認識だけとってみてもAIの世界は果てしない感じだ。

YOLOv3のYouTube^^;



.

by tullyz1 | 2019-10-12 13:33 | Comments(8)

信州・渋温泉2005(6)







d0108132_11114685.jpg




地獄谷 野猿公苑
------------


【今日のAI】
最近の私のAIのテーマは「ウォーリーを探せ!」をやらせることなのだが、
そこにたどり着くにはいろいろな障害がある。
今使っているAIのモデルであるSSD300なら、見つけた場所を四角で囲って教えてくれるが、
標準的なSSD300ではあらかじめ決まった20種類のものしか認識できない。
新たな対象を認識させるには学習が必要だ。
簡単な4層(脳のシナプスが4段みたいな感じ)くらいのディープ・ラーニングモデルなら
何度も学習させたことがあるが、SSD300は66層もあって、そのすべてを最初から学習させたら
何日もかかる。こういうときには転移学習という方法を使う。一部の「記憶」を消して、
そこだけを新しい対象で学習させ直すのだ。
ネットの記事を読んだときは簡単じゃんと思ったのだが、実際にやってみると
66層のどこを忘れさせればいいのかわからず、AIはすぐ何も認識できない認知症状態に陥る。
ウォーリーでは対象が微妙過ぎるので、とりあえずカエルでやっているのだが、
カエルの場所は適切に認識するがカエルを鳥だと判断したり、なんとかカエルを覚えると今度はオネーサンまで
カエルだと言い張ったり、子どもにモノの名前を教えるのはこういう大変さがあるのだろう。
試行錯誤を繰り返すこと2日くらいでようやく、どこまで記憶を消せば対象の在りかを認識できる状態のまま
オネーサンとカエルを判別できるかが分かってきた。
(ちなみに第32層が全結合層FC7なので、それ以降を再学習させる)
AIの道は果てしない。









.

by tullyz1 | 2019-10-08 17:12 | Comments(4)

信州・渋温泉2005(3)





d0108132_11002928.jpg


-----------


【今日のAI】
AIのためにGPUを買った話(3)

動いているときは快適なグラフィックボードなのだが、
何回かいろんなAIの学習をやると、突然クラッシュすることがあった。
グラフィックボードとAI用の処理装置が同じものなので、AIがクラッシュすると
Windowsの画面も道連れになる。
調べてみたら、「オネーサンを探せ!!」で使ったSSDというAIは一度に3GBくらいの
メモリーを使うので、2,3回同様の処理をさせると6GBしかないグラフィックボードの
メモリーを使い切り、死ぬのだ。AIの処理が終わったら、適切にアプリを閉じれば
そういうことは起きない。
わかってしまうとたいしたことでは無いのだが、わからないことが沢山ありすぎて
AIへの道は果てしない。






by tullyz1 | 2019-10-05 16:28 | Comments(4)

信州・渋温泉2005(2)






d0108132_10575172.jpg




-------------




【今日のAI】
AIのためにGPUを買った話(2)

NVIDIAのGPU 1060を搭載したグラフィックボードが届いた。
仕事をしていないときはファンが回らなくて静かなタイプ。
合計5.5GBもある巨大なソフトをどうにかインストールして、動作が確認できた。
 グラフィックボード・ドライバー   555MB   
 Visual Studio Community 2015 with Update 3  3.4GB   
 CUDA v9.0 + patch 1     1.4GB 
 cuDNN 7.14   177MB


教科書の例題に出てくる「手書き数字認識」の学習で速度を確認してみる。
CPU(i7@3.4GHz)で処理させると95秒のところ、
GPU(1060)で処理させると9.9秒。なんと9.6倍。
10時間もかかるとやる気が起きないが、1時間ならやってみようかという気になり、
30分は待てないが3分はその場で待てるので、この差は大きい。
この速さに慣れてしまうと、もう元には戻れない。

GoogleのWebサービスでも同じ処理をさせたら10.1秒だった。
以前はもっと速い気がしたのだが、こんなものだったか。
みんなが使うと遅くなるという話もあるが。




by tullyz1 | 2019-10-04 16:36 | Comments(8)