Python TensorFlow和为MS COCO准备数据_Python_Json_Tensorflow

Python TensorFlow和为MS COCO准备数据

python json tensorflow

Python TensorFlow和为MS COCO准备数据,python,json,tensorflow,Python,Json,Tensorflow,我不太明白如何准备数据以用于MS COCO数据集。我当前正在TFRecords中保存所有数据。对于每条记录，我需要保存jpeg数据以及所有注释。对于每个图像，最多可以有20个注释，对于每个注释，python列表中可以有多个多边形例如，我迭代所有分段，然后将其保存在TFRecord中 obj = { 'annotation/' + str(imgNb) + '/seg/' + str(_key): _float_feature(segmentations[_key]) for _key in r

我不太明白如何准备数据以用于MS COCO数据集。我当前正在

TFRecord

s中保存所有数据。对于每条记录，我需要保存jpeg数据以及所有注释。对于每个图像，最多可以有20个注释，对于每个注释，python列表中可以有多个多边形

例如，我迭代所有分段，然后将其保存在

TFRecord

中

obj = { 'annotation/' + str(imgNb) + '/seg/' + str(_key): _float_feature(segmentations[_key]) for _key in range(len(segmentations))}

这样做的问题是，我最终得到了可变长度

TFRecord

s。当我想调用

parse\u single\u example

时，我需要发送一个功能图，但我不知道注释的确切数量。假设在最坏的情况下，

功能图需要相当大
我还尝试用JSON文件保存它，但我仍然需要使用parse\u single\u example
来解析JSON，因此我仍然存在最初的问题
因此，问题是：
我应该创建一个非常大的功能图
并在每个训练步骤中检查哪些是空的，还是应该在将注释数据保存到TFRecord
s中之前尝试处理注释数据（将其转换为图像，这将产生一些相当大的文件，但我想可能是可行的）？还是有更好的办法
任何帮助或见解都将不胜感激！
谢谢
 您最好（1）将所有注释作为同一个功能，或者（2）始终将所有功能放在所有示例中，但为缺少的保留空值。
您最好（1）将所有注释作为同一个功能，或者（2）始终将所有功能放在所有示例中，但为缺少的值保留空值