Machine learning 一级与两级目标检测

Machine learning 一级与两级目标检测,machine-learning,computer-vision,artificial-intelligence,object-detection,yolo,Machine Learning,Computer Vision,Artificial Intelligence,Object Detection,Yolo,我正在阅读一篇论文,这篇论文经常被称为“一级和两级目标检测”。我无法理解这两种物体探测器之间的区别。我想 一个阶段仅使用一个网络进行区域检测和对象分类 两个阶段使用2个不同的网络执行上述操作 这个假设正确吗?与其说是“区域检测+目标分类”,不如说是“(1)区域方案+(2)两级检测器中的分类和定位 (1-区域提案)由所谓的区域提案网络(简称RPN)完成。RPN用于确定“何处”寻找以减少整个推理过程的计算要求。RPN快速有效地扫描每个位置,以评估是否需要在给定区域内执行进一步的处理。它通过输出k

我正在阅读一篇论文,这篇论文经常被称为“一级和两级目标检测”。我无法理解这两种物体探测器之间的区别。我想

  • 一个阶段仅使用一个网络进行区域检测和对象分类
  • 两个阶段使用2个不同的网络执行上述操作
这个假设正确吗?

与其说是“区域检测+目标分类”,不如说是“(1)区域方案+(2)两级检测器中的分类和定位

(1-区域提案)由所谓的区域提案网络(简称RPN)完成。RPN用于确定“何处”寻找以减少整个推理过程的计算要求。RPN快速有效地扫描每个位置,以评估是否需要在给定区域内执行进一步的处理。它通过输出k个边界框建议来实现这一点,每个建议有2个分数表示对象的概率或不是一个目标的概率t每个位置。换句话说,它用于查找预定义数量(~2000)的区域(边界框),这些区域可能包含对象

对象检测中的一个重要问题是生成一个可变长度的边界框列表。可变长度问题在RPN中通过使用锚来解决:固定大小的参考边界框,均匀地放置在原始图像中。我们不必检测对象的位置,而是将问题建模为两部分。对于每一位主持人,我们要求:

  • 该锚点是否包含相关对象
  • 我们如何调整此锚定以更好地适应相关对象
在原始图像中列出可能的相关对象及其位置后,这成为一个更容易解决的问题。使用CNN提取的特征和相关对象的边界框,我们应用感兴趣区域(RoI)将对应于相关对象的特征合并并提取为新的张量

接下来在第二阶段,R-CNN模块使用上述信息:

  • 对边界框中的内容进行分类(或使用 “背景”作为标签)
  • 调整边界框坐标(使其更适合对象)