【深入浅出强化学习】1 绪论
文章目录1.5 强化学习仿真环境构建1.5.1 gym 安装及简单的 demo 示例1.5.2 深入剖析gym环境构建1.5 强化学习仿真环境构建1.5.1 gym 安装及简单的 demo 示例pip3 install gym最简单的例子import gym% 导入Gym模块env = gym.make('CartPole-v0')% 创建一个小车倒立摆模型env.reset()% 初始化环境en
·
1.5 强化学习仿真环境构建
1.5.1 gym 安装及简单的 demo 示例
pip3 install gym
最简单的例子
import gym % 导入Gym模块
env = gym.make('CartPole-v0') % 创建一个小车倒立摆模型
env.reset() % 初始化环境
env.render() % 刷新当前环境并显示
通过这6步,就可以得到一个小车倒立摆系统。

1.5.2 深入剖析gym环境构建
-
reset()函数详解
初始化函数 -
render()函数详解
扮演图像引擎的角色。
其实,对于强化学习算法而言,可以没有 render() 函数,但是,为了便于直观显示当前环境中的物体,图像引擎还是有必要的。
step()函数详解
扮演物理引擎的角色。
在本函数中,一般利用智能体的运动学模型和动力学模型计算下一步的状态和立即回报,并判断是否达到终止状态。
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)