Machine learning 基于卷积神经网络的图像特征识别

Machine learning 基于卷积神经网络的图像特征识别,machine-learning,artificial-intelligence,neural-network,convolution,Machine Learning,Artificial Intelligence,Neural Network,Convolution,让我们假设您正在使用神经网络进行图像识别,并且您已经训练它来识别直线 每当一列特定的像素处于打开状态,而相邻像素处于关闭状态时,就会触发一个特定的节点,从而“识别”该行 到目前为止还不错,但是如果线条只向左或向右移动了几个像素呢 “直线”节点不再处于活动状态,因为它“反应”的像素列已关闭(直线太右或太左) 我天真的解决方案是分别训练网络识别图像每一部分的线条,但这似乎是混乱和过度的 因此,我的问题是: 无论线条在图像上的什么位置,神经网络如何识别线条?我读到卷积神经网络很好地解决了这个问题,有人

让我们假设您正在使用神经网络进行图像识别,并且您已经训练它来识别直线

每当一列特定的像素处于打开状态,而相邻像素处于关闭状态时,就会触发一个特定的节点,从而“识别”该行

到目前为止还不错,但是如果线条只向左或向右移动了几个像素呢

“直线”节点不再处于活动状态,因为它“反应”的像素列已关闭(直线太右或太左)

我天真的解决方案是分别训练网络识别图像每一部分的线条,但这似乎是混乱和过度的

因此,我的问题是:

无论线条在图像上的什么位置,神经网络如何识别线条?我读到卷积神经网络很好地解决了这个问题,有人能用不太专业的术语解释一下吗?


一旦它们被识别,关于它们位置的信息是如何进一步向上传输的(因为图像左侧的一条线可能与右侧的一条线具有不同的含义)福岛国彦子提出了分层多层神经网络(NN)1980年具备强大的视觉模式识别能力。在他的研究中,他调查了NN是如何训练线条的。使用三像素水平线、垂直线和不同角度的特定对角线变化作为训练样本。他的动机是想知道当想要的图案出现时,隐藏层的哪一部分会被点燃。他的结果还表明,这种经过训练的网络可以识别所有方向的线

与只允许输入向量的神经网络不同,卷积神经网络(CNN)允许在输入层使用二维阵列。从这个角度来看,可以直接将CNN视为一个局部滤波器,其中权重可以在学习过程中更新。隐藏层一小部分中的每个节点连接到输入图像局部区域中的像素及其邻域。在直线识别训练中,不仅更新了该零件内的权重,还通过学习增强了直线特征。是的,您可能已经注意到这就像一个边缘检测器,因为线像素上的权重将增加,而周围像素上的权重将减少,甚至变成负值

CNN的一个重要而独特的特征被称为。它产生独立于其位置和方向的线检测(注:局部区域中像素的权重相同,但每个邻域像素与中心像素或线像素之间的相对位置不同)


此外,它还提供了一种形式的平移不变性,进一步实现了直线识别中的位置独立性。

福岛国彦(Kunihiko Fukushima)于1980年提出了具有鲁棒视觉模式识别能力的分层多层神经网络(NN)。在他的研究中,他调查了NN是如何训练线条的。使用三像素水平线、垂直线和不同角度的特定对角线变化作为训练样本。他的动机是想知道当想要的图案出现时,隐藏层的哪一部分会被点燃。他的结果还表明,这种经过训练的网络可以识别所有方向的线

与只允许输入向量的神经网络不同,卷积神经网络(CNN)允许在输入层使用二维阵列。从这个角度来看,可以直接将CNN视为一个局部滤波器,其中权重可以在学习过程中更新。隐藏层一小部分中的每个节点连接到输入图像局部区域中的像素及其邻域。在直线识别训练中,不仅更新了该零件内的权重,还通过学习增强了直线特征。是的,您可能已经注意到这就像一个边缘检测器,因为线像素上的权重将增加,而周围像素上的权重将减少,甚至变成负值

CNN的一个重要而独特的特征被称为。它产生独立于其位置和方向的线检测(注:局部区域中像素的权重相同,但每个邻域像素与中心像素或线像素之间的相对位置不同)

此外,它还提供了一种形式的平移不变性机制,进一步实现了直线识别中的位置独立性