Image processing 卷积神经网络中深度的解释_Image Processing_Machine Learning_Neural Network_Tensorflow_Deep Learning

Image processing 卷积神经网络中深度的解释

image-processing machine-learning neural-network tensorflow deep-learning

Image processing 卷积神经网络中深度的解释,image-processing,machine-learning,neural-network,tensorflow,deep-learning,Image Processing,Machine Learning,Neural Network,Tensorflow,Deep Learning,我正在学习卷积神经网络，并试图找出数学计算是如何发生的。假设有一个具有3个通道（RGB）的输入图像，因此图像的形状为28*28*3。考虑6个过滤器的大小为5×5×3，步幅1适用于下一层。因此，我们将在下一层得到24*24*6。由于输入图像是RGB图像，每个过滤器的24*24图像如何解释为RGB图像，即，每个过滤器的内部构造大小为24*24*3的图像应用第一个卷积层后，就不能再认为它是RGB了。那[5,5,3]卷积从5*5*3=75浮点（25个像素，每个有3个通道）获取所有信息，并根据网络为该滤

我正在学习卷积神经网络，并试图找出数学计算是如何发生的。假设有一个具有3个通道（RGB）的输入图像，因此图像的形状为28*28*3。考虑6个过滤器的大小为5×5×3，步幅1适用于下一层。因此，我们将在下一层得到24*24*6。由于输入图像是RGB图像，每个过滤器的24*24图像如何解释为RGB图像，即，每个过滤器的内部构造大小为24*24*3的图像

应用第一个卷积层后，就不能再认为它是RGB了。那

[5,5,3]

卷积从

5*5*3=75

浮点（25个像素，每个有3个通道）获取所有信息，并根据网络为该滤波器训练的任何参数将其混合在一起

在许多图像识别任务中，第一层通常学习边缘检测器和锐化遮罩等。例如，请参见

但是输出本身就是。。。信息，在那一点上。或者，更准确地说，深度通道的意义将取决于网络的学习方式。可能会有一些有意义的东西来区分深度通道（以及其中不同的值意味着什么），但如果不尝试将其可视化，就不可能是直观的。我不知道有哪个项目可以独立地可视化深度通道，但可能有人会这样做。

好的，这很清楚。因此，在第一个卷积层，每个滤波器应用于所有3个通道（R、G和B），然后按元素添加该输出。这是正确的吗？这取决于你所说的应用是什么意思每个输出元素是“面片”（与过滤器大小相同）中所有输入元素的总和乘以相应的过滤器参数。深度为“k”的过滤器有k组完全不同的过滤器参数（它是4D），这些参数与3D输入面片相乘。每个“k”过滤器产生一个输出。这篇博文也可能以一种有用的方式呈现一些东西：TF文档中的定义：（关于解释步幅的答案也可能有用：）谢谢！我对实施过程有了一个概念。有没有学习如何在TensorFlow中构建cnn的来源？他们网站上的一个看起来有点复杂，卷积的MNIST例子可能是我所知道的最好的开始，但过去，我认为你最好为这个特定部分提出一个新问题。