Neural network Caffe HDF5预处理

Neural network Caffe HDF5预处理,neural-network,deep-learning,hdf5,caffe,lmdb,Neural Network,Deep Learning,Hdf5,Caffe,Lmdb,我正在开始学习Caffe和深度学习,我无法理解在HDF5数据上使用Caffe训练模型所需的预处理步骤。具体来说, 是否需要将图像转换为[0-1]范围。笔记本电脑示例(00 classification.ipynb)说明该模型在[0-255]范围内运行,而一些参考资料表明它应该是[0-1]。我怎么决定 根据文档,批量图像数据的传统blob尺寸为N x通道K x高度H x宽度W。在这方面没有冲突 RGB到BGR转换的通道交换步骤是强制性的吗 如何对HDF5数据执行图像平均值计算?对于compute\

我正在开始学习Caffe和深度学习,我无法理解在HDF5数据上使用Caffe训练模型所需的预处理步骤。具体来说,

  • 是否需要将图像转换为[0-1]范围。笔记本电脑示例(00 classification.ipynb)说明该模型在[0-255]范围内运行,而一些参考资料表明它应该是[0-1]。我怎么决定
  • 根据文档,批量图像数据的传统blob尺寸为N x通道K x高度H x宽度W。在这方面没有冲突
  • RGB到BGR转换的通道交换步骤是强制性的吗
  • 如何对HDF5数据执行图像平均值计算?对于
    compute\u image\u mean.cpp
    ,后端是lmdb。这只是为了提高性能
  • 关于LMDB的使用,问题1-3仍然有效。对此的任何澄清都将不胜感激

    欢迎来到caffe

    1。将输入数据缩放到[0..1]或[0..255]的范围完全取决于您。一些型号在[0..1]范围内工作,其他型号在[0..255]范围内工作,与输入法的选择(LMDB/HDF5)完全无关。
    这里最重要的是保持一致。如果您决定在[0..1]范围内工作,则必须确保以相同的方式准备培训集和验证集,并且“部署”阶段的新示例将缩放到相同的范围

    2.Caffe斑点始终是您已经观察到的4-D批次通道宽度高度

    3.RGB到BGR同样不是强制性的,但非常常见,因为BGR是opencv读取图像的方式。同样,这里最重要的事情是在网络的整个生命周期中保持一致性


    4.最近,模型减去每个通道的平均值,而不是每个像素的平均值。它更方便,尤其是如果您更改网络的输入大小。在处理HDF5数据时,您可以计算平均图像并将其保存到binaryproto中。请参阅。

    这是对预处理步骤的清晰总结。我找不到任何涵盖所有这些内容的文档。谢谢你。让我试试。非常感谢!我在任何地方都找不到涵盖所有这些的详细解释。我希望这对其他许多人也有用。