Reinforcement learning OpenAI健身房:理解“动作空间”符号(spaces.Box)

Reinforcement learning OpenAI健身房:理解“动作空间”符号(spaces.Box),reinforcement-learning,openai-gym,Reinforcement Learning,Openai Gym,我想在OpenAICarRacing-v0环境中设置一个RL代理,但在此之前我想了解操作空间。第119行说: self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1])) # steer, gas, brake 我怎么读这行?虽然我的问题是具体的wrtCarRacing-v0但我想了解一下空格.Box()符号的一般含义Box意味着你要处理的是实数 第一个数组np.array([-1,0,0]是可接受的最低值

我想在OpenAI
CarRacing-v0
环境中设置一个RL代理,但在此之前我想了解操作空间。第119行说:

self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1]))  # steer, gas, brake

我怎么读这行?虽然我的问题是具体的wrt
CarRacing-v0
但我想了解一下
空格.Box()
符号的一般含义

Box
意味着你要处理的是实数

第一个数组
np.array([-1,0,0]
是可接受的最低值,第二个
np.array([+1,+1,+1])
是可接受的最高值。在本例中(使用注释),我们看到有3个可用操作:

  • 转向:在
    [-1,1]
  • 气体:在
    [0,1]
  • 制动:在
    [0,1]