Python 我们是否可以裁剪输入激活以匹配ResNet论文中提到的输出维度
我试图用numpy从零开始用python实现Resnet。而单独的图层工作完美。我目前被困在conv2_3和conv3_1层之间,其中带有1x1、128个过滤器的conv3_1层以2的步幅对56x56到28x28的输入进行下采样。我目前正在建设152层一 我搞不懂的部分是当我应用这个表达式时Python 我们是否可以裁剪输入激活以匹配ResNet论文中提到的输出维度,python,numpy,tensorflow,torch,resnet,Python,Numpy,Tensorflow,Torch,Resnet,我试图用numpy从零开始用python实现Resnet。而单独的图层工作完美。我目前被困在conv2_3和conv3_1层之间,其中带有1x1、128个过滤器的conv3_1层以2的步幅对56x56到28x28的输入进行下采样。我目前正在建设152层一 我搞不懂的部分是当我应用这个表达式时 output_width = (input_width - filter_width + (2 * pad) ) / stride + 1 在这种情况下,结果是(56-1+(2*0))/2+1=28.5
output_width = (input_width - filter_width + (2 * pad) ) / stride + 1
在这种情况下,结果是(56-1+(2*0))/2+1=28.5,比要求的尺寸大。我觉得唯一的出路是裁剪输入图像(激活图),我不确定,因为这可能会导致图像信息耗尽。知道tensorflow、caffe和torch等其他图书馆是如何做到这一点的吗