Reinforcement learning OpenAI健身房:理解“动作空间”符号(spaces.Box)
我想在OpenAIReinforcement learning OpenAI健身房:理解“动作空间”符号(spaces.Box),reinforcement-learning,openai-gym,Reinforcement Learning,Openai Gym,我想在OpenAICarRacing-v0环境中设置一个RL代理,但在此之前我想了解操作空间。第119行说: self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1])) # steer, gas, brake 我怎么读这行?虽然我的问题是具体的wrtCarRacing-v0但我想了解一下空格.Box()符号的一般含义Box意味着你要处理的是实数 第一个数组np.array([-1,0,0]是可接受的最低值
CarRacing-v0
环境中设置一个RL代理,但在此之前我想了解操作空间。第119行说:
self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1])) # steer, gas, brake
我怎么读这行?虽然我的问题是具体的wrt
CarRacing-v0
但我想了解一下空格.Box()
符号的一般含义Box
意味着你要处理的是实数
第一个数组np.array([-1,0,0]
是可接受的最低值,第二个np.array([+1,+1,+1])
是可接受的最高值。在本例中(使用注释),我们看到有3个可用操作:
[-1,1]
[0,1]
[0,1]