Computer vision MaskRCNN/YOLO的性能与对象大小（像素）的函数关系_Computer Vision_Object Detection_Yolo_Faster Rcnn

Computer vision MaskRCNN/YOLO的性能与对象大小（像素）的函数关系

computer-vision

Computer vision MaskRCNN/YOLO的性能与对象大小（像素）的函数关系,computer-vision,object-detection,yolo,faster-rcnn,Computer Vision,Object Detection,Yolo,Faster Rcnn,我试图找到有关物体分辨率如何影响物体检测系统（如MaskRCNN和YOLO）正确识别物体能力的参考资料例如，如果相机被越来越远地放大，构成对象的像素数将缩小，最终对象将只占据一个像素。此时，算法只能使用单个像素的值，因此，即使是非常精确的算法也不太可能进行检测。我希望能找到任何一种参考资料，说明每一个物体的像素减少时，性能会如何下降。首先，我认为大多数物体检测论文中的实验结果支持你的直觉，即分辨率越低，检测准确度/精度越低。例如，如果您查看对象检测论文（如表3）实验结果中的AP-S、AP-M、

我试图找到有关物体分辨率如何影响物体检测系统（如MaskRCNN和YOLO）正确识别物体能力的参考资料

例如，如果相机被越来越远地放大，构成对象的像素数将缩小，最终对象将只占据一个像素。此时，算法只能使用单个像素的值，因此，即使是非常精确的算法也不太可能进行检测。我希望能找到任何一种参考资料，说明每一个物体的像素减少时，性能会如何下降。

首先，我认为大多数物体检测论文中的实验结果支持你的直觉，即分辨率越低，检测准确度/精度越低。例如，如果您查看对象检测论文（如表3）实验结果中的

AP-S、AP-M、AP-L

（*即小型、中型和大型对象的平均精度），您会发现

AP-S

与

AP-M

和

AP-L

相比大幅下降，尤其是对于一次性方法

其次，我认为为你的主张获得一些实验支持的一个好的起点是使用coco数据集，并稍微修改随附的

CoCoCoEval

脚本（如果我没有弄错的话，是cocoapi/PythonAPI/PycoTools/中的脚本）。如文档所述，小型、中型和大型对象的默认值如下：

APsmall
AP for small objects: area < 32^2
APmedium
AP for medium objects: 32^2 < area < 96^2
APlarge
AP for large objects: area > 96^2

APsmall
小型物体的AP：面积<32^2
apmedia
中等对象的AP:32^2<面积<96^2
巨大的
大型对象的AP：面积>96^2

您可以在小对象阈值上循环，从

32^2

开始，然后将其减小，直到达到某个最小区域，然后查看

AP small

分数是如何随着该阈值而减小的。这很可能会导致曲线下降，从而说明您的观点