Computer vision 为什么要在边界框上添加一个小数字?

Computer vision 为什么要在边界框上添加一个小数字?,computer-vision,object-detection,Computer Vision,Object Detection,我发现在快速(er)RCNN的实现中,边界框的宽度和高度总是增加了一个小值。为什么要在宽度和高度上加一个小数字 例如,在中添加了cfg.EPS(is1e-14): ex_widths=ex_rois[:,2]-ex_rois[:,0]+cfg.EPS ex_heights=ex_rois[:,3]-ex_rois[:,1]+cfg.EPS ex_ctr_x=ex_ROI[:,0]+0.5*ex_宽度 ex_ctr_y=ex_rois[:,1]+0.5*ex_高度 gt_宽度=gt_rois[:,

我发现在快速(er)RCNN的实现中,边界框的宽度和高度总是增加了一个小值。为什么要在宽度和高度上加一个小数字

例如,在中添加了
cfg.EPS
(is
1e-14
):

ex_widths=ex_rois[:,2]-ex_rois[:,0]+cfg.EPS
ex_heights=ex_rois[:,3]-ex_rois[:,1]+cfg.EPS
ex_ctr_x=ex_ROI[:,0]+0.5*ex_宽度
ex_ctr_y=ex_rois[:,1]+0.5*ex_高度
gt_宽度=gt_rois[:,2]-gt_rois[:,0]+cfg.EPS
gt_heights=gt_rois[:,3]-gt_rois[:,1]+cfg.EPS
gt_中心x=gt_rois[:,0]+0.5*gt_宽度
gt_中心y=gt_rois[:,1]+0.5*gt_高度
在中,
1.0
被添加到
宽度
高度

ex_widths=ex_rois[:,2]-ex_rois[:,0]+1.0
前投资回报率=前投资回报率[:,3]-前投资回报率[:,1]+1.0
ex_ctr_x=ex_ROI[:,0]+0.5*ex_宽度
ex_ctr_y=ex_rois[:,1]+0.5*ex_高度
gt_宽度=gt_rois[:,2]-gt_rois[:,0]+1.0
gt_高度=gt_rois[:,3]-gt_rois[:,1]+1.0
gt_中心x=gt_rois[:,0]+0.5*gt_宽度
gt_中心y=gt_rois[:,1]+0.5*gt_高度

我不知道在第一种情况下发生了什么,但在第二种情况下,左右位置似乎都在边界框内。因此,跨越的像素数必须包括左右位置。这就是添加1的原因

我有一种强烈的感觉,代码将继续使用方框的区域,并使用这些区域来计算IoU。如果是这样,您需要确保边界框实际上有一些非零区域。

我的意见。实际上,需要计算“边界框边框”上的像素。因此您需要排除它们(通过添加1)