Deep learning 有人能解释一下这个“问题”吗；“非滑动窗”；目标检测纸特征金字塔网络中的声明？_Deep Learning_Computer Vision_Pytorch_Retinanet

Deep learning 有人能解释一下这个“问题”吗；“非滑动窗”；目标检测纸特征金字塔网络中的声明？

deep-learning computer-vision pytorch

Deep learning 有人能解释一下这个“问题”吗；“非滑动窗”；目标检测纸特征金字塔网络中的声明？,deep-learning,computer-vision,pytorch,retinanet,Deep Learning,Computer Vision,Pytorch,Retinanet,用于目标检测的特征金字塔网络采用RPN技术创建检测器，并采用滑动窗口技术进行分类。为什么在5.2节中有“非滑动窗口”的说法文件中的扩展声明： 5.2。使用快速/更快的R-CNN进行目标检测接下来，我们研究基于区域（非滑动窗口）检测器的FPN 据我所知，FPN在检测任务中使用了滑动窗口。这一点也在本文中提到声明是 RPN说，FPN提取特征图，然后输入检测器进行对象检测。RPN在特征图上应用一个滑动窗口，对每个位置的对象性（是否有对象）和对象边界框进行预测感谢您提供的高级功能。用于对象检测的

用于目标检测的特征金字塔网络采用RPN技术创建检测器，并采用滑动窗口技术进行分类。为什么在5.2节中有“非滑动窗口”的说法

文件中的扩展声明： 5.2。使用快速/更快的R-CNN进行目标检测 接下来，我们研究基于区域（非滑动窗口）检测器的FPN

据我所知，FPN在检测任务中使用了滑动窗口。这一点也在本文中提到声明是

RPN说，FPN提取特征图，然后输入检测器进行对象检测。RPN在特征图上应用一个滑动窗口，对每个位置的对象性（是否有对象）和对象边界框进行预测

感谢您提供的高级功能。

用于对象检测的功能金字塔网络（FPN）不是RPN

FPN只是一种更好的特征提取方法。它将多个阶段的特征合并在一起，从而为对象检测管道的其余部分提供更好的特征（特别是因为它将第一阶段的特征合并在一起，从而为中小型对象的检测提供更好的特征）

正如最初的论文所说：“我们的目标是利用ConvNet的金字塔功能层次结构，其语义从低级到高级，以及构建一个始终具有高级语义的特征金字塔。生成的特征金字塔网络是通用的，在本文中，我们主要关注滑动窗口提议者（区域提议网络，简称RPN）[29]和基于区域的检测器（Fast R-CNN）“

所以他们用它来检查“两级”目标检测管道。第一阶段是RPN，这是他们在第5.1节中检查的内容，然后他们在第5.2节中检查分类阶段

快R-CNN快R-CNN等。。是基于区域的对象检测器，而不是滑动窗口检测器。他们从RPN中得到一组固定的区域进行分类，就是这样

这是一个很好的解释，你可以在

谢谢你的回答，我仍然困惑，我知道不是滑动窗口检测器，但它仍然使用滑动窗口技术对吗？在该地区的一块土地上。在这个链接medium.com/@jonathan_hui/…中，在下面的FasterRCNN部分中，这些声明“更快的R-CNN使用更多的锚。它部署了9个锚箱：3个不同的比例，3个不同的长宽比。每个位置使用…分数和4×9坐标。”，您将在图中看到它使用3x3滑动窗口作为锚。使用RPN的探测器部分使用滑动窗口