【深入浅出强化学习】1 绪论

文章目录1.5 强化学习仿真环境构建1.5.1 gym 安装及简单的 demo 示例1.5.2 深入剖析gym环境构建1.5 强化学习仿真环境构建1.5.1 gym 安装及简单的 demo 示例pip3 install gym最简单的例子import gym% 导入Gym模块env = gym.make('CartPole-v0')% 创建一个小车倒立摆模型env.reset()% 初始化环境en

Zhao-Jichao

475人浏览 · 2022-04-22 10:43:10

Zhao-Jichao · 2022-04-22 10:43:10 发布

文章目录

- 1.5 强化学习仿真环境构建
- - 1.5.1 gym 安装及简单的 demo 示例
  - 1.5.2 深入剖析gym环境构建

1.5 强化学习仿真环境构建

1.5.1 gym 安装及简单的 demo 示例

pip3 install gym

最简单的例子

import gym	% 导入Gym模块
env = gym.make('CartPole-v0')	% 创建一个小车倒立摆模型
env.reset()		% 初始化环境
env.render()	% 刷新当前环境并显示

通过这6步，就可以得到一个小车倒立摆系统。

在这里插入图片描述

1.5.2 深入剖析gym环境构建

reset() 函数详解
初始化函数
render() 函数详解
扮演图像引擎的角色。

其实，对于强化学习算法而言，可以没有 render() 函数，但是，为了便于直观显示当前环境中的物体，图像引擎还是有必要的。

step()函数详解
扮演物理引擎的角色。

在本函数中，一般利用智能体的运动学模型和动力学模型计算下一步的状态和立即回报，并判断是否达到终止状态。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

「极限压缩量化未来」Modelers GeekDay上海站圆满落幕

魔乐社区

量化挑战赛冠军专访：4小时啃下W4A8量化，我靠的是这些经验

魔乐社区

魔乐社区月度精选（26年3月）

魔乐社区

所有评论(0)

查看更多评论

Zhao-Jichao

@weixin_36815313

已为社区贡献49条内容

【深入浅出强化学习】1 绪论

Zhao-Jichao

文章目录

1.5 强化学习仿真环境构建

1.5.1 gym 安装及简单的 demo 示例

1.5.2 深入剖析gym环境构建

所有评论(0)

温馨提示：您尚未绑定手机号

Zhao-Jichao