人気ブログランキング |

2019年 11月 04日 ( 1 )

白馬 北尾根高原(5)









d0108132_23033989.jpg






---------------






d0108132_09144273.jpg


【今日のAI】
ゲームを通して強化学習(Q学習)を学べる「Open AI Gym」という開発環境がある。
棒倒しみたいな簡単なモノから、スペースインベーダーやパックマンといった
高度なものまで何十種類と取り揃えられている。

「ゲームを通して」というキャッチ―なフレーズではあるが、
自分で対戦ゲームに勝てるAIを作れということなので、全然簡単な話ではない。
全てのゲームに共通するのは、ある操作をしたら、その結果、画面がどうなって
得点はいくつで、ゲームオーバーかどうかという状況がデータとして戻ってくる。
勝てる一連の操作を選ぶことが課題だ。
前回の延長という感じで、Breakoutを選んだ。
ブロック崩し、ブレークアウトなどと呼ばれていたゲーム。
ボールをパドルで打ち返し、ブロックを崩して点数を競う。使えるボールは5つまで。
前回は24x24の画面で90%の成功率の達するまでに3000回の学習を行ったが、
今回は84x84と12.5倍の広さなので37000回の学習か。1ゲーム1秒としても10時間。
上達すると1ゲームの終了までの時間が長くなってくるので1回5秒なら50時間かorz
課題が例題から現実に近づいてくると、学習時間は非現実的になってくる。

800回ゲームを学習した限りでの最高得点は8点orz 下手に動かずじっとしていた方が
ボールが当たりに来てくれる感じがしないでもない。
AIの学習モデルが悪いのかもしれず、別のモデルを試すとなると、再び数十時間かかる。
AI開発はかくも地道な作業なのだ。AIは成果が出ないとか、開発費が高いとか言うのは
酷な話だ。

ちなみにOpen AIはあのイーロン・マスクがやっているNPO。





.


by tullyz1 | 2019-11-04 11:44 | Comments(2)