强化学习学习过程

https://github.com/syyxtl/RL-learn我会不断学习RL，然后跟着书籍编写RL学习代码：目前完成：K-bandits：了解ep-greedydp，dp2：dp methodrandom_walk：MC，TD(0) （doing）cliff_walking_sarsa, cliff_walking_Qlearning：sarsa，Q-learningrandom_walk

水野与小太郎

529人浏览 · 2020-08-11 10:22:17

水野与小太郎 · 2020-08-11 10:22:17 发布

https://github.com/syyxtl/RL-learn

我会不断学习RL，然后跟着书籍编写RL学习代码：

目前完成：

K-bandits：了解ep-greedy

dp，dp2：dp method

random_walk：MC，TD(0)

cliff_walking_sarsa, cliff_walking_Qlearning：sarsa，Q-learning

random_walk_1000：gradient_MC，semi_gradient_n_step_TD

mountain_car：semi_gradient_n_step_sarsa

mountain_car：linear method，DQN，Double-DQN