Tensorflow KITTI上的目标检测(奇怪纵横比)

Tensorflow KITTI上的目标检测(奇怪纵横比),tensorflow,object-detection,Tensorflow,Object Detection,我试图在KITTI数据集上训练任何对象检测器,该数据集具有奇怪的纵横比~370高度和1240宽度。在对模型动物园中的任何模型进行微调后,我都无法获得良好的检测结果。我采用了coco配置示例,只是将图像大小调整器参数更改为输入图像大小,并将类数更改为4 我首先按照教程中的说明创建了数据集的TFRecord文件,并检查了该文件,以确认图像、标签和其他信息已正确保存为二进制格式,因此数据集没有问题 当我用动物园的模型进行评估时,我得到了不错的检测结果。然而,当我尝试在我自己训练过的模型上进行评估时,检

我试图在KITTI数据集上训练任何对象检测器,该数据集具有奇怪的纵横比~370高度和1240宽度。在对模型动物园中的任何模型进行微调后,我都无法获得良好的检测结果。我采用了coco配置示例,只是将图像大小调整器参数更改为输入图像大小,并将类数更改为4

我首先按照教程中的说明创建了数据集的TFRecord文件,并检查了该文件,以确认图像、标签和其他信息已正确保存为二进制格式,因此数据集没有问题

当我用动物园的模型进行评估时,我得到了不错的检测结果。然而,当我尝试在我自己训练过的模型上进行评估时,检测结果非常糟糕,到处都是图像。在训练期间,对于ssd~.4和rfcn~.0004,损失也极低。我想这与图像大小有关,但我不确定。有人知道为什么在新的数据集上检测结果会如此糟糕吗

以下是我从ssd模型中获得的边界框类型示例:

示例检测


我的问题是TFRecord文件。边界框坐标和标签具有错误的键,因此网络在没有边界框的空图像上进行训练。这也解释了为什么我的误差会收敛到0,因为网络的权重只是被正则化压扁了,而不会因为本地化而损失形成梯度。

既然这解决了问题,你可以接受分数下面的绿色勾号作为答案