强化学习-在线可视化-值迭代-karpathy-以及我自己的DQN-格子世界可视化
强化学习-在线可视化-值迭代-karpathy文章目录强化学习-在线可视化-值迭代-karpathy前言:网页链接:前言:之前因为好奇值迭代的具体过程,所以搜了一下可视化的工具和内容。发现了这个特别好使的网页!虽然我自己也写了一个简版的格子世界,值迭代可视化版本,但是和这个相比,启动起来还是太麻烦了…等我有空开源一下~但是半年后的今天,我竟然忘了这个网页叫啥来着,搜了好久,才找到。想着在博客记录一
强化学习-在线可视化-值迭代-karpathy
前言:
之前因为好奇值迭代的具体过程,所以搜了一下可视化的工具和内容。
发现了这个特别好使的网页!
虽然我自己也写了一个简版的格子世界,值迭代可视化版本,但是和这个相比,启动起来还是太麻烦了…
等我有空开源一下~
我的项目:Keras-DQN-格子世界
我的可视化脚本终于上传啦!!!
欢迎围观!
https://github.com/kaixindelele/DQN-keras-visualization-with-gridworld
可以调格子大小、奖励函数、格子位置(这个没封装好…)
关键是可视化了q值…
可视化效果:
但是半年后的今天,我竟然忘了这个网页叫啥来着,搜了好久,才找到。
想着在博客记录一下,才好
karpathy的项目:值迭代+格子世界:
https://cs.stanford.edu/people/karpathy/reinforcejs/gridworld_td.html
可以设置单点的奖励值,可以设置探索度,非常方便,直观。
没玩过的,强烈建议玩一玩~

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)