Playing Atari with Deep Reinforcement Learning
http://www.iclr.cc/lib/exe/fetch.php?media=iclr2015:silver-iclr2015.pdf
DeepMind。ゲームをNNでやるという話。
DeepMind。ゲームをNNでやるという話。
- ATARI 2600のゲーム7種に適用。同一ネットワーク。ハイパーパラメータも同じ。
- CNNをQ-learningの一種でtrain
- 入力はピクセルで、出力は将来の報酬を予測する関数。
- End-to-End で学習。つまり、ピクセルの認識とゲームのルールに対する学習を一度に行う。(たぶんLISは違う。)
- ネットワークは5層程度。サイズも小さいし、深くもない。
- 入力はピクセル、出力は各アクションに対する報酬の予測値?
- 入力画像を白黒4ビット化して処理している。これは相当不利な条件のはずだが遜色ない性能を得ているとのこと。
- 100万フレームとか食わせている。おそろしい。
0 件のコメント:
コメントを投稿