1.5 强化学习仿真环境构建

1.5.1 gym 安装及简单的 demo 示例

pip3 install gym

最简单的例子

import gym	% 导入Gym模块
env = gym.make('CartPole-v0')	% 创建一个小车倒立摆模型
env.reset()		% 初始化环境
env.render()	% 刷新当前环境并显示

通过这6步,就可以得到一个小车倒立摆系统。

在这里插入图片描述

1.5.2 深入剖析gym环境构建

  1. reset() 函数详解
    初始化函数

  2. render() 函数详解
    扮演图像引擎的角色。

其实,对于强化学习算法而言,可以没有 render() 函数,但是,为了便于直观显示当前环境中的物体,图像引擎还是有必要的。

  1. step()函数详解
    扮演物理引擎的角色。

在本函数中,一般利用智能体的运动学模型动力学模型计算下一步的状态和立即回报,并判断是否达到终止状态。

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐