Computer vision 什么';在快速R-CNN和SPP网络中用于假设生成的外部算法是什么?

Computer vision 什么';在快速R-CNN和SPP网络中用于假设生成的外部算法是什么?,computer-vision,conv-neural-network,object-detection,image-segmentation,faster-rcnn,Computer Vision,Conv Neural Network,Object Detection,Image Segmentation,Faster Rcnn,我知道在R-CNN中,我们需要选择性搜索作为生成感兴趣区域建议的外部算法,但在Fast R-CNN中,我们可以简单地获取整个图像,然后将其传递到卷积网络以创建特征图,然后使用单层SPP(RoI池层) 另一方面,我们在SPP网络中使用了多层SPP。供快速参考和理解 在慢速R-CNN、SPP-net和快速R-CNN中,感兴趣区域(ROI)分别来自于一种提议方法(“选择性搜索”、、、?) 有人能详细解释并引用SPP net和Fast R-CNN中明确使用的提案方法吗?因为,我在研究论文中没有详细提到

我知道在R-CNN中,我们需要选择性搜索作为生成感兴趣区域建议的外部算法,但在Fast R-CNN中,我们可以简单地获取整个图像,然后将其传递到卷积网络以创建特征图,然后使用单层SPP(RoI池层)

另一方面,我们在SPP网络中使用了多层SPP。供快速参考和理解

在慢速R-CNN、SPP-net和快速R-CNN中,感兴趣区域(ROI)分别来自于一种提议方法(“选择性搜索”、


有人能详细解释并引用SPP net和Fast R-CNN中明确使用的提案方法吗?因为
,我在研究论文中没有详细提到它?

官方github报告显示,SPP net和Fast R-CNN都使用了与R-CNN相同的地区提案方法,即“选择性搜索”:

和。在SPP_net repo中,有一个用于计算区域建议的选择性搜索模块,在fast r-cnn repo中,作者特别提到了计算对象建议的方法是选择性搜索

但同样,生成区域建议也可以使用其他方法,因为R-CNN和Fast R-CNN采用对象建议方法作为独立于检测器的外部模块

一般来说,如果一种方法产生更多的建议,它可以有利于最终的检测精度,但这当然会限制检测速度。 在第2节“相关工作”中,对所有对象建议生成方法进行了很好的总结

对于后续问题,即如何在特征图中直观地描绘区域建议,可以在下图()中更好地说明:

在图中,卷积运算后左侧的红色框将成为右侧输出卷中的红色方块,绿色框对应绿色方块等。现在想象左侧的整个7x7是区域建议,然后在输出特征图上,它仍然是区域建议! 当然,在现实中,左边的图像有更多的像素,因此可能会有许多区域建议,并且这些建议中的每一个仍然看起来像输出功能图上的区域建议

最后,在原文中,作者解释了他们如何准确地将区域建议从原始图像转换到特征地图上的候选窗口。

谢谢,还有一个后续问题,我可以直观地理解R-CNN首先在原始像素(图像)上创建ROI,然后应用CNN获得特征图,我在SPP net&Fast R-CNN中没有理解的是,我们是如何通过在特征图上应用选择性搜索获得与以前相同的ROI的?同一地区的提案如何进行。或者,即使在原始图像或特征地图上应用不同的方法,也会产生相同的表示,有助于相同或更好的目标检测精度?我没有完全理解它。请在您的帖子中详细说明一下。SPP网络上的选择性搜索也会在原始原始像素上进行,但区域建议将转换为特征地图上的相应建议,这就是为什么我添加了这一部分来解释为什么原始图像上的区域建议仍然看起来像特征地图上的区域建议,这也解释了为什么选择性搜索可以用作外部模块,因为它只依赖于原始输入图像。现在,为了获得固定的表示,功能地图上的每个建议都将通过一个池层来获得最终表示,通常,无论提案的大小,这种表示都是固定长度的。在所有三种情况下,SS算法都将应用于原始图像!没有区别!SS算法不会应用于特征地图。只有原始图像上的边界框才会转换为特征图上的边界框(n通道和不同纵横比)。