2023-06-24から1日間の記事一覧
先程のentryの続きで、参考urlからの写経です 参考url 【入門】Q学習の解説とpythonでの実装 〜シンプルな迷路問題を例に〜 import copy import numpy as np import matplotlib.pyplot as plt EPISODE = 100 # 学習回数 def main(): grid_env = GridWorld() …
マルコフ決定過程、Q学習、TD誤差、ε-greedy等の用語が多く、自分なりに整理 参考url 強化学習やQ学習とは? 機械学習における位置づけ 強化学習とは Q学習とは Q値更新式と、マルコフ決定過程、TD学習 マルコフ決定過程(Markov Decision Process MDP)とは? Q…