Deep learning 有人能解释一下这个“问题”吗;“非滑动窗”;目标检测纸特征金字塔网络中的声明?

Deep learning 有人能解释一下这个“问题”吗;“非滑动窗”;目标检测纸特征金字塔网络中的声明?,deep-learning,computer-vision,pytorch,retinanet,Deep Learning,Computer Vision,Pytorch,Retinanet,用于目标检测的特征金字塔网络采用RPN技术创建检测器,并采用滑动窗口技术进行分类。为什么在5.2节中有“非滑动窗口”的说法 文件中的扩展声明: 5.2。使用快速/更快的R-CNN进行目标检测 接下来,我们研究基于区域(非滑动窗口)检测器的FPN 据我所知,FPN在检测任务中使用了滑动窗口。这一点也在本文中提到 声明是 RPN说,FPN提取特征图,然后输入检测器进行对象检测。RPN在特征图上应用一个滑动窗口,对每个位置的对象性(是否有对象)和对象边界框进行预测 感谢您提供的高级功能。用于对象检测的

用于目标检测的特征金字塔网络采用RPN技术创建检测器,并采用滑动窗口技术进行分类。为什么在5.2节中有“非滑动窗口”的说法

文件中的扩展声明: 5.2。使用快速/更快的R-CNN进行目标检测 接下来,我们研究基于区域(非滑动窗口)检测器的FPN

据我所知,FPN在检测任务中使用了滑动窗口。这一点也在本文中提到 声明是

RPN说,FPN提取特征图,然后输入检测器进行对象检测。RPN在特征图上应用一个滑动窗口,对每个位置的对象性(是否有对象)和对象边界框进行预测

感谢您提供的高级功能。

用于对象检测的功能金字塔网络(FPN)不是RPN

FPN只是一种更好的特征提取方法。它将多个阶段的特征合并在一起,从而为对象检测管道的其余部分提供更好的特征(特别是因为它将第一阶段的特征合并在一起,从而为中小型对象的检测提供更好的特征)

正如最初的论文所说:“我们的目标是利用ConvNet的金字塔功能 层次结构,其语义从低级到高级,以及 构建一个始终具有高级语义的特征金字塔。生成的特征金字塔网络是通用的,在本文中,我们主要关注滑动窗口提议者(区域提议网络,简称RPN)[29]和 基于区域的检测器(Fast R-CNN)

所以他们用它来检查“两级”目标检测管道。第一阶段是RPN,这是他们在第5.1节中检查的内容,然后他们在第5.2节中检查分类阶段

快R-CNN快R-CNN等。。是基于区域的对象检测器,而不是滑动窗口检测器。他们从RPN中得到一组固定的区域进行分类,就是这样


这是一个很好的解释,你可以在

谢谢你的回答,我仍然困惑,我知道不是滑动窗口检测器,但它仍然使用滑动窗口技术对吗?在该地区的一块土地上。在这个链接medium.com/@jonathan_hui/…中,在下面的FasterRCNN部分中,这些声明“更快的R-CNN使用更多的锚。它部署了9个锚箱:3个不同的比例,3个不同的长宽比。每个位置使用…分数和4×9坐标。”,您将在图中看到它使用3x3滑动窗口作为锚。使用RPN的探测器部分使用滑动窗口