end0tknr's kipple - web写経開発

太宰府天満宮の狛犬って、妙にカワイイ

2023-06-24から1日間の記事一覧

強化学習(Q学習)のpython実装

先程のentryの続きで、参考urlからの写経です 参考url 【入門】Q学習の解説とpythonでの実装 〜シンプルな迷路問題を例に〜 import copy import numpy as np import matplotlib.pyplot as plt EPISODE = 100 # 学習回数 def main(): grid_env = GridWorld() …

強化学習におけるマルコフ決定過程やQ学習を再整理

マルコフ決定過程、Q学習、TD誤差、ε-greedy等の用語が多く、自分なりに整理 参考url 強化学習やQ学習とは? 機械学習における位置づけ 強化学習とは Q学習とは Q値更新式と、マルコフ決定過程、TD学習 マルコフ決定過程(Markov Decision Process MDP)とは? Q…