Python 3.x 具有离散值和盒值的OpenAI健身房观察空间_Python 3.x_Openai Gym

Python 3.x 具有离散值和盒值的OpenAI健身房观察空间

python-3.x

Python 3.x 具有离散值和盒值的OpenAI健身房观察空间,python-3.x,openai-gym,Python 3.x,Openai Gym,我正在尝试为OpenAi健身房创建一个自定义环境我的观察空间将具有以下值：读数：10倍-1比1连续计数：0到1000离散开/关：0或1离散从文档中，我似乎可以创建一个包含一些低值和高值、离散值或元组的框所以，如果我用这12个东西（10个连续的，2个离散的）创建一个盒子，并将其定义为float32，这仍然有效吗？还是有更好的办法我曾尝试将其定义为Dict空间，但似乎这只适用于GoalEnv，并且有一组非常具体的键。你解决了这个问题吗？@Rexcirus没有让我满意。最后我用了一个

我正在尝试为OpenAi健身房创建一个自定义环境

我的观察空间将具有以下值：

读数：10倍-1比1连续
计数：0到1000离散
开/关：0或1离散

从文档中，我似乎可以创建一个包含一些低值和高值、离散值或元组的框

所以，如果我用这12个东西（10个连续的，2个离散的）创建一个盒子，并将其定义为float32，这仍然有效吗？还是有更好的办法

我曾尝试将其定义为Dict空间，但似乎这只适用于GoalEnv，并且有一组非常具体的键。

你解决了这个问题吗？@Rexcirus没有让我满意。最后我用了一个装有所有浮子的盒子。它确实奏效了。使用多种类型和元组目前似乎不可能。我也想这样做，但这似乎仍然是正在进行的研究的主题（我发现这篇论文试图结合离散和连续动作空间：）。我想更大的问题是，目前还没有（据我所知）支持元组或Dict空间的算法。你解决了这个问题吗？@Rexcirus令我不满意。最后我用了一个装有所有浮子的盒子。它确实奏效了。使用多种类型和元组目前似乎不可能。我也想这样做，但这似乎仍然是正在进行的研究的主题（我发现这篇论文试图结合离散和连续动作空间：）。我想更大的问题是，目前还没有（据我所知）支持元组或Dict空间的算法。