Image processing 卷积神经网络的图像预处理

Image processing 卷积神经网络的图像预处理,image-processing,matrix,convolution,Image Processing,Matrix,Convolution,我有*.png文件,我想将图像转换为卷积神经网络环境中的一种热编码 我的图像是224x224。我搜索了许多在线参考资料,但我不太明白如何将图像转换为一种热编码。我是逐行追加还是逐列追加?一种方式比另一种好吗 创建一个热编码向量后,将应用规范化操作,例如将向量的每个值除以256(RGB的最大值)。这样可以防止数字膨胀并导致溢出。但是,我也看到从该值中减去了0.5。为什么会这样?这有效地将值的范围置于[-0.5,0.5]之间。然而,在大多数convnet中,应用了一个ReLU层,该层将使所有这些值变

我有
*.png
文件,我想将图像转换为卷积神经网络环境中的一种热编码

  • 我的图像是
    224x224
    。我搜索了许多在线参考资料,但我不太明白如何将图像转换为一种热编码。我是逐行追加还是逐列追加?一种方式比另一种好吗
  • 创建一个热编码向量后,将应用规范化操作,例如将向量的每个值除以
    256
    (RGB的最大值)。这样可以防止数字膨胀并导致溢出。但是,我也看到从该值中减去了
    0.5
    。为什么会这样?这有效地将值的范围置于
    [-0.5,0.5]
    之间。然而,在大多数convnet中,应用了一个
    ReLU
    层,该层将使所有这些值变为零或更大。所以,我不明白为什么要这样做
  • 最后,一旦我将图像转换成一个热编码向量,我在哪里添加偏差项?我把它加在一个热编码向量的前面还是后面,这个值到底应该是什么?给定向量的标准化,我通常看到偏差项是一个添加到向量前面的
    1
    。但是,为什么我们选择
    1
    ,为什么它通常附加在前面
  • 我想,我回答了你关于stats stackexchange的部分问题:)我猜你是被搞混了,因为你正在考虑将一个图像转换为一个热编码表示。这不是它的工作原理。一个热编码只是关于标签,您不需要转换图像(来自我上面的评论)
  • 同样,当你对一个热标签感到困惑时(仔细阅读一下),你不会处理一个热编码标签。处理图像(本例中为预处理)。法线可以是各种类型。对于深度学习,通常的方法是进行归一化,使平均值为0,标准偏差为1。我没有尝试使用(-0.5,0.5)进行正常化,而是回答您关于ReLU的问题。ReLU是用来引入非线性的。如果你多读一些关于深度学习(特别是反向传播)的书会更好
  • 再一次!你混淆了深度学习。偏差项是在训练过程中添加的。这是过程的一部分。既然你在问这个问题,你需要阅读神经网络
  • 这个简单的教程播放列表帮助我理解了深度学习,希望这对你也有帮助


    祝您学习顺利:)

    我想,我已经回答了您在stats stackexchange上的问题:)我猜您可能会混淆,因为您正在考虑将图像转换为onehot编码表示。这不是它的工作原理。一个热编码只是关于标签,你不需要转换图像。嗯,我明白了。非常感谢。我会看清楚的!