Computer vision 扩张性回旋、萎缩、感受野_Computer Vision_Convolution_Convolutional Neural Network

Computer vision 扩张性回旋、萎缩、感受野

computer-vision

Computer vision 扩张性回旋、萎缩、感受野,computer-vision,convolution,convolutional-neural-network,Computer Vision,Convolution,Convolutional Neural Network,我不明白扩张性回旋的感受野的价值。事实上，例如，对于规则卷积3x3，感受野是3x3。两个3x3接受野为5x5。但是对于扩张的卷积，它是如何工作的呢事实上，4次膨胀意味着1次卷积3x3，然后我们应用另一个卷积5x5（只有9个值不同于0），然后是卷积7x7（只有9个值不同于0），最后是卷积9x9？如果是这种情况，我不理解4次膨胀的15x15值。如果我的计算是正确的，通过3次扩张，我得到了13x13。我错在哪里正如您在链接问题的答案中所看到的，步长（卷积输入值之间的距离）呈指数增长，而不是线性增长

我不明白扩张性回旋的感受野的价值。事实上，例如，对于规则卷积3x3，感受野是3x3。两个3x3接受野为5x5。但是对于扩张的卷积，它是如何工作的呢

事实上，4次膨胀意味着1次卷积3x3，然后我们应用另一个卷积5x5（只有9个值不同于0），然后是卷积7x7（只有9个值不同于0），最后是卷积9x9？如果是这种情况，我不理解4次膨胀的15x15值。如果我的计算是正确的，通过3次扩张，我得到了13x13。我错在哪里

正如您在链接问题的答案中所看到的，步长（卷积输入值之间的距离）呈指数增长，而不是线性增长。如图所示的4倍放大卷积使用了3层（我在这里链接图像以供参考）：

每次应用3x3卷积，但输入样本之间的距离会增加：第一层为1，第二层为2，第三层为4。前两层共同产生一个感受野，每个红点周围有一个3x3块，形成一个7x7感受野。在第三层，9个红点中的每一个再次重复这些7x7块，形成15x15的感受野

请注意，应该可以进一步增加这些距离，因为存在相当多的重叠（图中较暗的阴影区域）：第二层的步长为3，导致9x9，第三层的步长为9，导致27x27。我不知道这是否会导致性能下降，我从未应用过这种技术