Python TensorFlow和为MS COCO准备数据
我不太明白如何准备数据以用于MS COCO数据集。我当前正在Python TensorFlow和为MS COCO准备数据,python,json,tensorflow,Python,Json,Tensorflow,我不太明白如何准备数据以用于MS COCO数据集。我当前正在TFRecords中保存所有数据。对于每条记录,我需要保存jpeg数据以及所有注释。对于每个图像,最多可以有20个注释,对于每个注释,python列表中可以有多个多边形 例如,我迭代所有分段,然后将其保存在TFRecord中 obj = { 'annotation/' + str(imgNb) + '/seg/' + str(_key): _float_feature(segmentations[_key]) for _key in r
TFRecord
s中保存所有数据。对于每条记录,我需要保存jpeg数据以及所有注释。对于每个图像,最多可以有20个注释,对于每个注释,python列表中可以有多个多边形
例如,我迭代所有分段,然后将其保存在TFRecord
中
obj = { 'annotation/' + str(imgNb) + '/seg/' + str(_key): _float_feature(segmentations[_key]) for _key in range(len(segmentations))}
这样做的问题是,我最终得到了可变长度TFRecord
s。当我想调用parse\u single\u example
时,我需要发送一个功能图,但我不知道注释的确切数量。假设在最坏的情况下,功能图需要相当大
我还尝试用JSON文件保存它,但我仍然需要使用parse\u single\u example
来解析JSON,因此我仍然存在最初的问题
因此,问题是:
我应该创建一个非常大的功能图
并在每个训练步骤中检查哪些是空的,还是应该在将注释数据保存到TFRecord
s中之前尝试处理注释数据(将其转换为图像,这将产生一些相当大的文件,但我想可能是可行的)?还是有更好的办法
任何帮助或见解都将不胜感激!
谢谢 您最好(1)将所有注释作为同一个功能,或者(2)始终将所有功能放在所有示例中,但为缺少的保留空值。您最好(1)将所有注释作为同一个功能,或者(2)始终将所有功能放在所有示例中,但为缺少的值保留空值