Computer vision 扩张性回旋、萎缩、感受野

Computer vision 扩张性回旋、萎缩、感受野,computer-vision,convolution,convolutional-neural-network,Computer Vision,Convolution,Convolutional Neural Network,我不明白扩张性回旋的感受野的价值。事实上,例如,对于规则卷积3x3,感受野是3x3。两个3x3接受野为5x5。但是对于扩张的卷积,它是如何工作的呢 事实上,4次膨胀意味着1次卷积3x3,然后我们应用另一个卷积5x5(只有9个值不同于0),然后是卷积7x7(只有9个值不同于0),最后是卷积9x9?如果是这种情况,我不理解4次膨胀的15x15值。如果我的计算是正确的,通过3次扩张,我得到了13x13。我错在哪里 正如您在链接问题的答案中所看到的,步长(卷积输入值之间的距离)呈指数增长,而不是线性增长

我不明白扩张性回旋的感受野的价值。事实上,例如,对于规则卷积3x3,感受野是3x3。两个3x3接受野为5x5。但是对于扩张的卷积,它是如何工作的呢

事实上,4次膨胀意味着1次卷积3x3,然后我们应用另一个卷积5x5(只有9个值不同于0),然后是卷积7x7(只有9个值不同于0),最后是卷积9x9?如果是这种情况,我不理解4次膨胀的15x15值。如果我的计算是正确的,通过3次扩张,我得到了13x13。我错在哪里


正如您在链接问题的答案中所看到的,步长(卷积输入值之间的距离)呈指数增长,而不是线性增长。如图所示的4倍放大卷积使用了3层(我在这里链接图像以供参考):

每次应用3x3卷积,但输入样本之间的距离会增加:第一层为1,第二层为2,第三层为4。前两层共同产生一个感受野,每个红点周围有一个3x3块,形成一个7x7感受野。在第三层,9个红点中的每一个再次重复这些7x7块,形成15x15的感受野

请注意,应该可以进一步增加这些距离,因为存在相当多的重叠(图中较暗的阴影区域):第二层的步长为3,导致9x9,第三层的步长为9,导致27x27。我不知道这是否会导致性能下降,我从未应用过这种技术