https://github.com/syyxtl/RL-learn

我会不断学习RL,然后跟着书籍编写RL学习代码:

目前完成:

 

K-bandits:了解ep-greedy

dp,dp2:dp method

random_walk:MC,TD(0) 

cliff_walking_sarsa, cliff_walking_Qlearning:sarsa,Q-learning

random_walk_1000:gradient_MC,semi_gradient_n_step_TD

mountain_car:semi_gradient_n_step_sarsa

mountain_car:linear method,DQN,Double-DQN

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐