Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/359.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 具有强化学习的gk机器人的Keras高损耗和高精度?_Python_Keras_Deep Learning_Bots_Reinforcement Learning - Fatal编程技术网

Python 具有强化学习的gk机器人的Keras高损耗和高精度?

Python 具有强化学习的gk机器人的Keras高损耗和高精度?,python,keras,deep-learning,bots,reinforcement-learning,Python,Keras,Deep Learning,Bots,Reinforcement Learning,我正在哈克斯鲍尔比赛中制造守门员机器人。当我训练较少时效果很好,但当我训练较多时效果更差 最后强化状态:5160集-4171281步-0.05 epsilon: 上次拟合结果=acc:0.9905,损失:293408940460887.5000 (以前的拟合结果如下:acc:0.7,损耗:0.012) 最后一场比赛结果图片: 此Keras模型: NBACTIONS=3 窗宽=630 窗户高度=400 IMGHEIGHT=int(窗高/5) IMGWIDTH=int(窗口宽度/5) IMGHIST

我正在哈克斯鲍尔比赛中制造守门员机器人。当我训练较少时效果很好,但当我训练较多时效果更差

最后强化状态:5160集-4171281步-0.05 epsilon

上次拟合结果=acc:0.9905,损失:293408940460887.5000

(以前的拟合结果如下:acc:0.7,损耗:0.012

最后一场比赛结果图片:

此Keras模型:

NBACTIONS=3
窗宽=630
窗户高度=400
IMGHEIGHT=int(窗高/5)
IMGWIDTH=int(窗口宽度/5)
IMGHISTORY=4
模型=顺序()
添加(Conv2D(32,内核大小=4,步幅=(2,2),输入形状=(DCQL\u Global.IMGHEIGHT,DCQL\u Global.IMGWIDTH,DCQL\u Global.IMGHISTORY),padding=“相同”))
添加(激活(“relu”))
添加(MaxPool2D(池大小=(2,2)))
add(Conv2D(64,内核大小=4,步幅=(2,2),padding=“相同”))
添加(激活(“relu”))
添加(MaxPool2D(池大小=(2,2)))
添加(BatchNormalization())
add(Conv2D(64,内核大小=3,步幅=(1,1),padding=“相同”))
添加(激活(“relu”))
添加(MaxPool2D(池大小=(2,2)))
model.add(展平())
模型添加(密集(512))
添加(激活(“relu”))
添加(密集(单位=DCQL\u Global.NBACTIONS,activation=“linear”))
compile(loss=“mse”,optimizer=Adam(lr=0.0001),metrics=['accurity']
奖励规则=进球:-1,救球(不缺球):+1,踢球后如果gk正确跟球+0.01否则gk错误跟球-0.01奖励

我正在对图像进行预处理,如下链接所示:

预处理代码:

def ProcessGameImage(I):
GreyImage=skiliage.color.rgb2gray(I)
裁剪图像=灰色图像
ReducedImage=skimage.transform.resize(cropeImage,(DCQL_Global.IMGHEIGHT,DCQL_Global.IMGWIDTH))
还原图像=撇除。曝光。重新缩放强度(还原图像,超出范围=(0255))
ReducedImage=ReducedImage/255.0
返回ReducedImage.astype(np.float)

什么是我的错?

不确定这里的RL具体情况,但感谢@desertnaut的评论