用于对象检测API tensorflow的规范化标签框

用于对象检测API tensorflow的规范化标签框,tensorflow,object-detection,Tensorflow,Object Detection,当我使用labelImg()在对象周围绘制边界框以输出annotation.xml文件时,它给出了边界框的坐标。我使用这些注释输入tensorflow中的对象检测模型(ssd_mobilenet_v1_coco和faster_rcnn_resnet101_coco)。预测的输出(xmin,ymin,xmax,ymax)是从0到1 my annotation.xml中的输入是否规范化为0-1?我想知道这一点,因为我想通过在我自己的IOU函数中输入地面真相和预测边界框来获得IOU。谢谢基本上,如果您

当我使用labelImg()在对象周围绘制边界框以输出annotation.xml文件时,它给出了边界框的坐标。我使用这些注释输入tensorflow中的对象检测模型(ssd_mobilenet_v1_coco和faster_rcnn_resnet101_coco)。预测的输出(xmin,ymin,xmax,ymax)是从0到1


my annotation.xml中的输入是否规范化为0-1?我想知道这一点,因为我想通过在我自己的IOU函数中输入地面真相和预测边界框来获得IOU。谢谢

基本上,如果您为模型提供tf.record文件,它将包含您的图像和边界框的标准化坐标。因此,从.xml文件到tf.record文件的转换也将规范化边界框坐标

模型的输出也将以标准化坐标表示。通过与图像大小相乘,可以轻松地重新缩放它们:

x_min_abs = x_min_rel * image_width
x_max_abs = x_max_rel * image_width
y_min_abs = y_min_rel * image_height
y_max_abs = y_max_rel * image_height