tensorflow对象检测api的图像注释格式到tfrecords的转换
正在寻求有关对象检测API的图像注释格式的帮助tensorflow对象检测api的图像注释格式到tfrecords的转换,tensorflow,annotations,tensorflow-datasets,object-detection-api,tfrecord,Tensorflow,Annotations,Tensorflow Datasets,Object Detection Api,Tfrecord,正在寻求有关对象检测API的图像注释格式的帮助 预知: 正如我们所知,图像有两种注释格式,Pascal VOC和COCO格式。两者都有各自的规格,这是两者的主要区别: 帕斯卡挥发性有机化合物: 以.xml文件格式存储注释 边界框格式[x-top-left,y-top-left,x-bottom-right,y-bottom-right] 为数据集中的每个图像创建单独的xml注释文件 可可: 以.json文件格式存储注释 边界框格式[x-左上角,y-左上角,宽度,高度] 为每个培训、测试和验证
- 预知:
- 当前问题:
- 文件格式:Pascal VOC(.xml)
- 边框格式:COCO
- 文件创建:如Pascal VOC(数据集中每个图像的单独xml注释文件)
- 文件格式:Pascal VOC(.xml)
- 边框格式:COCO
- 文件创建:与COCO一样(为每个培训、测试和验证创建一个注释文件)
create\u tf\u示例
函数中进行以下更改
for index, row in group.TextLine.iterrows():
xmin.append(row['X']/imgwidth)
xmax.append((row['X']+row['Width'])/imgwidth)
ymin.append(row['Y']/imgheight)
ymax.append((row['Y']+row['Height'])/imgheight)
classes_text.append(row['class'].encode('utf8'))
classes.append(class_text_to_int(row['class']))'