Tensorflow 在CNN中使用图像时,尺寸意味着什么?
请通读下面的代码。图像大小为(32、256、256、6)。我认为没有必要知道什么是网络,它做什么。我的问题纯粹是分析性的Tensorflow 在CNN中使用图像时,尺寸意味着什么?,tensorflow,image-processing,conv-neural-network,Tensorflow,Image Processing,Conv Neural Network,请通读下面的代码。图像大小为(32、256、256、6)。我认为没有必要知道什么是网络,它做什么。我的问题纯粹是分析性的 net = slim.conv2d(input_images, 64, [5, 5], stride=1, scope='conv1') net = slim.max_pool2d(net, [2, 2], scope='pool1') # image size is (batch_size, 256 , 256 , 6) net =
net = slim.conv2d(input_images, 64, [5, 5], stride=1, scope='conv1')
net = slim.max_pool2d(net, [2, 2], scope='pool1') # image size is (batch_size, 256 , 256 , 6)
net = slim.conv2d(net, 128, [5, 5], stride=1, scope='conv2')
net = slim.max_pool2d(net, [2, 2], scope='pool2')
net = slim.conv2d(net, 256, [3, 3], stride=1, scope='conv3')
net = slim.max_pool2d(net, [2, 2], scope='pool3')
net = tf.image.resize_bilinear(net, [64,64])
net = slim.conv2d(net, 256, [3, 3], stride=1, scope='conv4')
net = tf.image.resize_bilinear(net, [128,128])
net = slim.conv2d(net, 128, [3, 3], stride=1, scope='conv5')
net = tf.image.resize_bilinear(net, [256,256]) #(32 , 256 , 256 , 3)
net = slim.conv2d(net, 64, [5, 5], stride=1, scope='conv6')
net = slim.conv2d(net, 3, [5, 5], stride=1, activation_fn=tf.tanh,
normalizer_fn=None, scope='conv7') # 32*248*248*3
根据我的说法,网络的尺寸是(322482483)。但显然,根据这篇论文,它应该是(32,256,256,3)
问题1)我哪里出错了
问题2)在slim.conv2d中,64和[5,5]到底是什么?我认为它们是过滤器的数量,5*5是内核的维度。但既然我得到了错误的维度,我在这里也错了吗
问题3)当你说(32256256,3)时,是否意味着有32个样本,256*256是像素强度,3是通道数
问题4)我知道这可能很难回答,但有人能告诉我,需要先减小尺寸,然后再增大尺寸吗?非常感谢与该概念的链接