Python TensorFlow和为MS COCO准备数据

Python TensorFlow和为MS COCO准备数据,python,json,tensorflow,Python,Json,Tensorflow,我不太明白如何准备数据以用于MS COCO数据集。我当前正在TFRecords中保存所有数据。对于每条记录,我需要保存jpeg数据以及所有注释。对于每个图像,最多可以有20个注释,对于每个注释,python列表中可以有多个多边形 例如,我迭代所有分段,然后将其保存在TFRecord中 obj = { 'annotation/' + str(imgNb) + '/seg/' + str(_key): _float_feature(segmentations[_key]) for _key in r

我不太明白如何准备数据以用于MS COCO数据集。我当前正在
TFRecord
s中保存所有数据。对于每条记录,我需要保存jpeg数据以及所有注释。对于每个图像,最多可以有20个注释,对于每个注释,python列表中可以有多个多边形

例如,我迭代所有分段,然后将其保存在
TFRecord

obj = { 'annotation/' + str(imgNb) + '/seg/' + str(_key): _float_feature(segmentations[_key]) for _key in range(len(segmentations))}
这样做的问题是,我最终得到了可变长度
TFRecord
s。当我想调用
parse\u single\u example
时,我需要发送一个功能图,但我不知道注释的确切数量。假设在最坏的情况下,
功能图需要相当大

我还尝试用JSON文件保存它,但我仍然需要使用
parse\u single\u example
来解析JSON,因此我仍然存在最初的问题

因此,问题是: 我应该创建一个非常大的
功能图
并在每个训练步骤中检查哪些是空的,还是应该在将注释数据保存到
TFRecord
s中之前尝试处理注释数据(将其转换为图像,这将产生一些相当大的文件,但我想可能是可行的)?还是有更好的办法

任何帮助或见解都将不胜感激!
谢谢

您最好(1)将所有注释作为同一个功能,或者(2)始终将所有功能放在所有示例中,但为缺少的保留空值。

您最好(1)将所有注释作为同一个功能,或者(2)始终将所有功能放在所有示例中,但为缺少的值保留空值