対戦相手を画面外まで吹っ飛ばせたかどうかを報酬とし、ゲームキューブのメモリの状態を入力として次に行うべき最適なコントローラ操作を判断するDeep Q-Networkの学習を行う事で、とてつもなくスマブラが上手いAIを作り出す論文 https://arxiv.org/abs/1702.06230
3:58 AM - 20 Apr 2017
0 replies
140 retweets
146 likes
Loading seems to be taking a while.
Twitter may be over capacity or experiencing a momentary hiccup. Try again or visit Twitter Status for more information.