自定义数据的tensorflow对象检测标签

自定义数据的tensorflow对象检测标签,tensorflow,object-detection,bounding-box,Tensorflow,Object Detection,Bounding Box,我有一个代码来获取图像的宽度和高度,以及边界框的类,xmin,xmax,ymin,ymax。但目前尚不清楚如何填充变量以生成TFR记录。根据下面的代码 height=None#图像高度 宽度=无#图像宽度 filename=None#图像的文件名。如果图像不是来自文件,则为空 encoded_image_data=None#编码图像字节 image\u format=None\b'jpeg'或b'png' xmins=[]#边界框中规范化的左x坐标列表(每个框1个) xmaxs=[]#边界框

我有一个代码来获取图像的宽度和高度,以及边界框的类,xmin,xmax,ymin,ymax。但目前尚不清楚如何填充变量以生成TFR记录。根据下面的代码

height=None#图像高度

宽度=无#图像宽度

filename=None#图像的文件名。如果图像不是来自文件,则为空
encoded_image_data=None#编码图像字节
image\u format=None\b'jpeg'或b'png'

xmins=[]#边界框中规范化的左x坐标列表(每个框1个)
xmaxs=[]#边界框中规范化的右x坐标列表#(每个框1个)
ymins=[]#边界框中的标准化顶部y坐标列表(每个框1个)

ymaxs=[]#边界框中规范化底部y坐标列表#(每个框1个)
classes\u text=[]#边界框的字符串类名称列表(每个框1个)

classes=[]#边界框的整数类id列表(每个框1个)


对于每个图像的多个边界框,应如何填充xmin、xmax、ymin、ymax和类?它们应该是行向量还是列向量?另外,对于类文本,它是否会根据边界框的顺序列出所有类名?此外,编码图像数据中需要什么?

以下是为Tensorflow对象检测API设置自定义数据集的指南:

在您的例子中,xmin、xmax等应该只是一个普通的python列表。图像编码应该是jpeg或png(我相信两者都可以互换使用,但如果可能的话,我建议坚持使用一种格式以保持一致性)