Neural network 建立openai健身房
我被赋予了一项任务,建立一个openai玩具健身房,这只能由一个有记忆的代理来解决。我得到了一个有两个门的例子,在t=0时,我显示为1或-1。在t=1时,我可以移动到正确的门并打开它Neural network 建立openai健身房,neural-network,lstm,rnn,openai-gym,Neural Network,Lstm,Rnn,Openai Gym,我被赋予了一项任务,建立一个openai玩具健身房,这只能由一个有记忆的代理来解决。我得到了一个有两个门的例子,在t=0时,我显示为1或-1。在t=1时,我可以移动到正确的门并打开它 有人知道我会怎么开始吗?我想证明a2c或ppo可以使用lstm策略解决这个问题。如何设置环境等?要以gym格式创建新环境,它应该具有gym.core文件中提到的5个功能 把它一步一步地放下来- 为您的环境定义观察空间和行动空间,最好使用gym.spaces模块 写下执行代理操作的step函数,并返回一个4元组,其
有人知道我会怎么开始吗?我想证明a2c或ppo可以使用lstm策略解决这个问题。如何设置环境等?要以gym格式创建新环境,它应该具有gym.core文件中提到的5个功能 把它一步一步地放下来-