Deep learning 如何使用两个不同大小的图像作为深度网络的输入?
我正在尝试训练一个深度神经网络,它使用来自两个独立图像的信息,以获得类似的最终图像输出。区别在于我的两个输入图像没有任何空间关系,因为它们是完全不同的图像,具有不同的信息量。如何使用两流CNN或任何其他使用这些类型输入的架构Deep learning 如何使用两个不同大小的图像作为深度网络的输入?,deep-learning,Deep Learning,我正在尝试训练一个深度神经网络,它使用来自两个独立图像的信息,以获得类似的最终图像输出。区别在于我的两个输入图像没有任何空间关系,因为它们是完全不同的图像,具有不同的信息量。如何使用两流CNN或任何其他使用这些类型输入的架构 供参考:一个图像有大小(5184x3456),另一个有大小(640x240)。首先:有两个图像并不重要。当您将一个图像作为输入时,您会遇到完全相同的问题,即单个图像可能具有不同的大小 解决此问题有多种策略: 裁剪和缩放:只需强制输入所需的大小即可。裁剪是为了确保纵横比正确
供参考:一个图像有大小(5184x3456),另一个有大小(640x240)。首先:有两个图像并不重要。当您将一个图像作为输入时,您会遇到完全相同的问题,即单个图像可能具有不同的大小 解决此问题有多种策略:
- 裁剪和缩放:只需强制输入所需的大小即可。裁剪是为了确保纵横比正确。有时,同一幅图像的不同部分被送入网络,结果被合并(例如平均)
- 卷积+全局池:卷积层不关心输入大小。在你关心它的时候,你可以做出决定。这意味着您有一个池区域,它将始终覆盖完整的输入,无论大小
- 特殊层:我不记得其概念或名称,但有些层允许不同大小的输入。。。也许这是一种基于注意力的方法
- 凯拉斯:
- Caffe: