强化学习 学习过程
https://github.com/syyxtl/RL-learn我会不断学习RL,然后跟着书籍编写RL学习代码:目前完成:K-bandits:了解ep-greedydp,dp2:dp methodrandom_walk:MC,TD(0) (doing)cliff_walking_sarsa, cliff_walking_Qlearning:sarsa,Q-learningrandom_walk
·
https://github.com/syyxtl/RL-learn
我会不断学习RL,然后跟着书籍编写RL学习代码:
目前完成:
K-bandits:了解ep-greedy
dp,dp2:dp method
random_walk:MC,TD(0)
cliff_walking_sarsa, cliff_walking_Qlearning:sarsa,Q-learning
random_walk_1000:gradient_MC,semi_gradient_n_step_TD
mountain_car:semi_gradient_n_step_sarsa
mountain_car:linear method,DQN,Double-DQN
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)