Machine learning 一级与两级目标检测_Machine Learning_Computer Vision_Artificial Intelligence_Object Detection_Yolo

Machine learning 一级与两级目标检测

machine-learning computer-vision artificial-intelligence

Machine learning 一级与两级目标检测,machine-learning,computer-vision,artificial-intelligence,object-detection,yolo,Machine Learning,Computer Vision,Artificial Intelligence,Object Detection,Yolo,我正在阅读一篇论文，这篇论文经常被称为“一级和两级目标检测”。我无法理解这两种物体探测器之间的区别。我想一个阶段仅使用一个网络进行区域检测和对象分类两个阶段使用2个不同的网络执行上述操作这个假设正确吗？与其说是“区域检测+目标分类”，不如说是“（1）区域方案+（2）两级检测器中的分类和定位（1-区域提案）由所谓的区域提案网络（简称RPN）完成。RPN用于确定“何处”寻找以减少整个推理过程的计算要求。RPN快速有效地扫描每个位置，以评估是否需要在给定区域内执行进一步的处理。它通过输出k

我正在阅读一篇论文，这篇论文经常被称为“一级和两级目标检测”。我无法理解这两种物体探测器之间的区别。我想

一个阶段仅使用一个网络进行区域检测和对象分类
两个阶段使用2个不同的网络执行上述操作

这个假设正确吗？

与其说是“区域检测+目标分类”，不如说是“（1）区域方案+（2）两级检测器中的分类和定位

（1-区域提案）由所谓的区域提案网络（简称RPN）完成。RPN用于确定“何处”寻找以减少整个推理过程的计算要求。RPN快速有效地扫描每个位置，以评估是否需要在给定区域内执行进一步的处理。它通过输出k个边界框建议来实现这一点，每个建议有2个分数表示对象的概率或不是一个目标的概率t每个位置。换句话说，它用于查找预定义数量（~2000）的区域（边界框），这些区域可能包含对象

对象检测中的一个重要问题是生成一个可变长度的边界框列表。可变长度问题在RPN中通过使用锚来解决：固定大小的参考边界框，均匀地放置在原始图像中。我们不必检测对象的位置，而是将问题建模为两部分。对于每一位主持人，我们要求：

该锚点是否包含相关对象
我们如何调整此锚定以更好地适应相关对象

在原始图像中列出可能的相关对象及其位置后，这成为一个更容易解决的问题。使用CNN提取的特征和相关对象的边界框，我们应用感兴趣区域（RoI）将对应于相关对象的特征合并并提取为新的张量

接下来在第二阶段，R-CNN模块使用上述信息：

对边界框中的内容进行分类（或使用 “背景”作为标签）
调整边界框坐标（使其更适合对象）