Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/tensorflow/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
tensorflow对象检测api中的边界框格式_Tensorflow - Fatal编程技术网

tensorflow对象检测api中的边界框格式

tensorflow对象检测api中的边界框格式,tensorflow,Tensorflow,提前感谢。 我尝试将tensorflow对象检测api与手动和web结合使用。 但我对tensorflow对象检测api中的边界框格式感到困惑。 在本教程中,TODA(tensorflow对象检测api)服务于几个预训练模型, 并用coco数据集对其进行训练 在coco数据集中, bbox foramt是[xmin,ymin,width,height], 有很多bbox格式, centerx、centery、宽度、高度或xmin、ymin、xmax、ymax TODA应该使用哪种bbox格式??

提前感谢。
我尝试将tensorflow对象检测api与手动和web结合使用。
但我对tensorflow对象检测api中的边界框格式感到困惑。
在本教程中,TODA(tensorflow对象检测api)服务于几个预训练模型, 并用coco数据集对其进行训练

在coco数据集中,
bbox foramt是[xmin,ymin,width,height],
有很多bbox格式, centerx、centery、宽度、高度或xmin、ymin、xmax、ymax

TODA应该使用哪种bbox格式?? (我应该使用coco格式吗??)
我找不到任何关于这个的信息

还有x轴和y轴,这也是混淆的。 我知道X代表宽度,Y代表高度

bun TODA代码, 我找到了这个。
def断言或删除无效的框(框):

ymin,xmin,ymax,xmax=tf.split( 框,数量或大小拆分=4,轴=1)

为什么x、y切换??
TODA轴与其他轴不同

谢谢。

预知: 图像有两种注释格式,Pascal VOC和COCO格式。两者都有各自的规格,这是两者的主要区别:

帕斯卡挥发性有机化合物:

  • 以.xml文件格式存储注释
  • 边界框格式[x-top-left,y-top-left,x-bottom-right,y-bottom-right]
  • 为数据集中的每个图像创建单独的xml注释文件
  • 可可:

  • 以.json文件格式存储注释
  • 边界框格式[x-左上角,y-左上角,宽度,高度]
  • 为每个培训、测试和验证创建一个注释文件
  • TODA应该使用哪种bbox格式??(我应该使用coco格式吗??)

    这取决于数据集使用的注释格式。如果批注是.xml格式,则必须使用Pascal VOC格式作为边界框,反之亦然

    还有x轴和y轴,这也是混淆的。 为什么x,y切换?? TODA轴与其他轴不同

    您不必对此感到困惑,因为如果您使用的是Pascal VOC格式,则注释文件必须包含[x-top-left、y-top-left、x-bottom-right、y-bottom-right]或[x-min、y-min、x-max、y-max]仅此而已

    如果您使用COCO格式标题,则注释格式必须包含[x-top-left,y-top-left,width,height]或[x,y,width,height]