【2024年度シラバス対応】理論から学ぶ強化学習

【内容】

強化学習の基礎知識を紹介した後、方策ベース(policy-based)と価値ベース(value-based)について学び、Q学習からDQN(Deep Q-Network)の流れについて説明していきます。Chapter3では、強化学習を用いた手法の中の一つであるAlphaGoについて説明します。

添削課題