Image processing 卷积神经网络中深度的解释

Image processing 卷积神经网络中深度的解释,image-processing,machine-learning,neural-network,tensorflow,deep-learning,Image Processing,Machine Learning,Neural Network,Tensorflow,Deep Learning,我正在学习卷积神经网络,并试图找出数学计算是如何发生的。假设有一个具有3个通道(RGB)的输入图像,因此图像的形状为28*28*3。考虑6个过滤器的大小为5×5×3,步幅1适用于下一层。因此,我们将在下一层得到24*24*6。由于输入图像是RGB图像,每个过滤器的24*24图像如何解释为RGB图像,即,每个过滤器的内部构造大小为24*24*3的图像 应用第一个卷积层后,就不能再认为它是RGB了。那[5,5,3]卷积从5*5*3=75浮点(25个像素,每个有3个通道)获取所有信息,并根据网络为该滤

我正在学习卷积神经网络,并试图找出数学计算是如何发生的。假设有一个具有3个通道(RGB)的输入图像,因此图像的形状为28*28*3。考虑6个过滤器的大小为5×5×3,步幅1适用于下一层。因此,我们将在下一层得到24*24*6。由于输入图像是RGB图像,每个过滤器的24*24图像如何解释为RGB图像,即,每个过滤器的内部构造大小为24*24*3的图像

应用第一个卷积层后,就不能再认为它是RGB了。那
[5,5,3]
卷积从
5*5*3=75
浮点(25个像素,每个有3个通道)获取所有信息,并根据网络为该滤波器训练的任何参数将其混合在一起

在许多图像识别任务中,第一层通常学习边缘检测器和锐化遮罩等。例如,请参见


但是输出本身就是。。。信息,在那一点上。或者,更准确地说,深度通道的意义将取决于网络的学习方式。可能会有一些有意义的东西来区分深度通道(以及其中不同的值意味着什么),但如果不尝试将其可视化,就不可能是直观的。我不知道有哪个项目可以独立地可视化深度通道,但可能有人会这样做。

好的,这很清楚。因此,在第一个卷积层,每个滤波器应用于所有3个通道(R、G和B),然后按元素添加该输出。这是正确的吗?这取决于你所说的应用是什么意思每个输出元素是“面片”(与过滤器大小相同)中所有输入元素的总和乘以相应的过滤器参数。深度为“k”的过滤器有k组完全不同的过滤器参数(它是4D),这些参数与3D输入面片相乘。每个“k”过滤器产生一个输出。这篇博文也可能以一种有用的方式呈现一些东西:TF文档中的定义:(关于解释步幅的答案也可能有用:)谢谢!我对实施过程有了一个概念。有没有学习如何在TensorFlow中构建cnn的来源?他们网站上的一个看起来有点复杂,卷积的MNIST例子可能是我所知道的最好的开始,但过去,我认为你最好为这个特定部分提出一个新问题。