Python 3.x 具有离散值和盒值的OpenAI健身房观察空间

Python 3.x 具有离散值和盒值的OpenAI健身房观察空间,python-3.x,openai-gym,Python 3.x,Openai Gym,我正在尝试为OpenAi健身房创建一个自定义环境 我的观察空间将具有以下值: 读数:10倍-1比1连续 计数:0到1000离散 开/关:0或1离散 从文档中,我似乎可以创建一个包含一些低值和高值、离散值或元组的框 所以,如果我用这12个东西(10个连续的,2个离散的)创建一个盒子,并将其定义为float32,这仍然有效吗?还是有更好的办法 我曾尝试将其定义为Dict空间,但似乎这只适用于GoalEnv,并且有一组非常具体的键。你解决了这个问题吗?@Rexcirus没有让我满意。最后我用了一个

我正在尝试为OpenAi健身房创建一个自定义环境

我的观察空间将具有以下值:

  • 读数:10倍-1比1连续
  • 计数:0到1000离散
  • 开/关:0或1离散
从文档中,我似乎可以创建一个包含一些低值和高值、离散值或元组的框

所以,如果我用这12个东西(10个连续的,2个离散的)创建一个盒子,并将其定义为float32,这仍然有效吗?还是有更好的办法


我曾尝试将其定义为Dict空间,但似乎这只适用于GoalEnv,并且有一组非常具体的键。

你解决了这个问题吗?@Rexcirus没有让我满意。最后我用了一个装有所有浮子的盒子。它确实奏效了。使用多种类型和元组目前似乎不可能。我也想这样做,但这似乎仍然是正在进行的研究的主题(我发现这篇论文试图结合离散和连续动作空间:)。我想更大的问题是,目前还没有(据我所知)支持元组或Dict空间的算法。你解决了这个问题吗?@Rexcirus令我不满意。最后我用了一个装有所有浮子的盒子。它确实奏效了。使用多种类型和元组目前似乎不可能。我也想这样做,但这似乎仍然是正在进行的研究的主题(我发现这篇论文试图结合离散和连续动作空间:)。我想更大的问题是,目前还没有(据我所知)支持元组或Dict空间的算法。