Computer vision MaskRCNN/YOLO的性能与对象大小(像素)的函数关系

Computer vision MaskRCNN/YOLO的性能与对象大小(像素)的函数关系,computer-vision,object-detection,yolo,faster-rcnn,Computer Vision,Object Detection,Yolo,Faster Rcnn,我试图找到有关物体分辨率如何影响物体检测系统(如MaskRCNN和YOLO)正确识别物体能力的参考资料 例如,如果相机被越来越远地放大,构成对象的像素数将缩小,最终对象将只占据一个像素。此时,算法只能使用单个像素的值,因此,即使是非常精确的算法也不太可能进行检测。我希望能找到任何一种参考资料,说明每一个物体的像素减少时,性能会如何下降。首先,我认为大多数物体检测论文中的实验结果支持你的直觉,即分辨率越低,检测准确度/精度越低。例如,如果您查看对象检测论文(如表3)实验结果中的AP-S、AP-M、

我试图找到有关物体分辨率如何影响物体检测系统(如MaskRCNN和YOLO)正确识别物体能力的参考资料


例如,如果相机被越来越远地放大,构成对象的像素数将缩小,最终对象将只占据一个像素。此时,算法只能使用单个像素的值,因此,即使是非常精确的算法也不太可能进行检测。我希望能找到任何一种参考资料,说明每一个物体的像素减少时,性能会如何下降。

首先,我认为大多数物体检测论文中的实验结果支持你的直觉,即分辨率越低,检测准确度/精度越低。例如,如果您查看对象检测论文(如表3)实验结果中的
AP-S、AP-M、AP-L
(*即小型、中型和大型对象的平均精度),您会发现
AP-S
AP-M
AP-L
相比大幅下降,尤其是对于一次性方法

其次,我认为为你的主张获得一些实验支持的一个好的起点是使用coco数据集,并稍微修改随附的
CoCoCoEval
脚本(如果我没有弄错的话,是cocoapi/PythonAPI/PycoTools/中的脚本)。如文档所述,小型、中型和大型对象的默认值如下:

APsmall
AP for small objects: area < 32^2
APmedium
AP for medium objects: 32^2 < area < 96^2
APlarge
AP for large objects: area > 96^2
APsmall
小型物体的AP:面积<32^2
apmedia
中等对象的AP:32^2<面积<96^2
巨大的
大型对象的AP:面积>96^2
您可以在小对象阈值上循环,从
32^2
开始,然后将其减小,直到达到某个最小区域,然后查看
AP small
分数是如何随着该阈值而减小的。这很可能会导致曲线下降,从而说明您的观点