Computer vision 为什么要在边界框上添加一个小数字？_Computer Vision_Object Detection

Computer vision 为什么要在边界框上添加一个小数字？

computer-vision

Computer vision 为什么要在边界框上添加一个小数字？,computer-vision,object-detection,Computer Vision,Object Detection,我发现在快速（er）RCNN的实现中，边界框的宽度和高度总是增加了一个小值。为什么要在宽度和高度上加一个小数字例如，在中添加了cfg.EPS（is1e-14）： ex_widths=ex_rois[：，2]-ex_rois[：，0]+cfg.EPS ex_heights=ex_rois[：，3]-ex_rois[：，1]+cfg.EPS ex_ctr_x=ex_ROI[：，0]+0.5*ex_宽度 ex_ctr_y=ex_rois[：，1]+0.5*ex_高度 gt_宽度=gt_rois[：，

我发现在快速（er）RCNN的实现中，边界框的宽度和高度总是增加了一个小值。为什么要在宽度和高度上加一个小数字

例如，在中添加了

cfg.EPS

（is

1e-14

）：

ex_widths=ex_rois[：，2]-ex_rois[：，0]+cfg.EPS
ex_heights=ex_rois[：，3]-ex_rois[：，1]+cfg.EPS
ex_ctr_x=ex_ROI[：，0]+0.5*ex_宽度
ex_ctr_y=ex_rois[：，1]+0.5*ex_高度
gt_宽度=gt_rois[：，2]-gt_rois[：，0]+cfg.EPS
gt_heights=gt_rois[：，3]-gt_rois[：，1]+cfg.EPS
gt_中心x=gt_rois[：，0]+0.5*gt_宽度
gt_中心y=gt_rois[：，1]+0.5*gt_高度

在中，

1.0

被添加到

宽度

和

高度

ex_widths=ex_rois[：，2]-ex_rois[：，0]+1.0
前投资回报率=前投资回报率[：，3]-前投资回报率[：，1]+1.0
ex_ctr_x=ex_ROI[：，0]+0.5*ex_宽度
ex_ctr_y=ex_rois[：，1]+0.5*ex_高度
gt_宽度=gt_rois[：，2]-gt_rois[：，0]+1.0
gt_高度=gt_rois[：，3]-gt_rois[：，1]+1.0
gt_中心x=gt_rois[：，0]+0.5*gt_宽度
gt_中心y=gt_rois[：，1]+0.5*gt_高度

我不知道在第一种情况下发生了什么，但在第二种情况下，左右位置似乎都在边界框内。因此，跨越的像素数必须包括左右位置。这就是添加1的原因

我有一种强烈的感觉，代码将继续使用方框的区域，并使用这些区域来计算IoU。如果是这样，您需要确保边界框实际上有一些非零区域。

我的意见。实际上，需要计算“边界框边框”上的像素。因此您需要排除它们（通过添加1）