自定义数据的tensorflow对象检测标签_Tensorflow_Object Detection_Bounding Box

自定义数据的tensorflow对象检测标签

tensorflow

自定义数据的tensorflow对象检测标签,tensorflow,object-detection,bounding-box,Tensorflow,Object Detection,Bounding Box,我有一个代码来获取图像的宽度和高度，以及边界框的类，xmin，xmax，ymin，ymax。但目前尚不清楚如何填充变量以生成TFR记录。根据下面的代码 height=None#图像高度宽度=无#图像宽度 filename=None#图像的文件名。如果图像不是来自文件，则为空 encoded_image_data=None#编码图像字节 image\u format=None\b'jpeg'或b'png' xmins=[]#边界框中规范化的左x坐标列表（每个框1个） xmaxs=[]#边界框

我有一个代码来获取图像的宽度和高度，以及边界框的类，xmin，xmax，ymin，ymax。但目前尚不清楚如何填充变量以生成TFR记录。根据下面的代码

height=None#图像高度


宽度=无#图像宽度


filename=None#图像的文件名。如果图像不是来自文件，则为空

encoded_image_data=None#编码图像字节

image\u format=None\b'jpeg'或b'png'

xmins=[]#边界框中规范化的左x坐标列表（每个框1个）

xmaxs=[]#边界框中规范化的右x坐标列表#（每个框1个）

ymins=[]#边界框中的标准化顶部y坐标列表（每个框1个）

ymaxs=[]#边界框中规范化底部y坐标列表#（每个框1个）

classes\u text=[]#边界框的字符串类名称列表（每个框1个）


classes=[]#边界框的整数类id列表（每个框1个）

对于每个图像的多个边界框，应如何填充xmin、xmax、ymin、ymax和类？它们应该是行向量还是列向量？另外，对于类文本，它是否会根据边界框的顺序列出所有类名？此外，编码图像数据中需要什么？

以下是为Tensorflow对象检测API设置自定义数据集的指南：

在您的例子中，xmin、xmax等应该只是一个普通的python列表。图像编码应该是jpeg或png（我相信两者都可以互换使用，但如果可能的话，我建议坚持使用一种格式以保持一致性）