【内容】
強化学習の基礎知識を紹介した後、方策ベース(policy-based)と価値ベース(value-based)について学び、Q学習からDQN(Deep Q-Network)の流れについて説明していきます。Chapter3では、強化学習を用いた手法の中の一つであるAlphaGoについて説明します。
添削課題