Machine learning 神经网络输出中的包围盒估计

Machine learning 神经网络输出中的包围盒估计,machine-learning,neural-network,conv-neural-network,Machine Learning,Neural Network,Conv Neural Network,我正在研究一种卷积神经网络,用于识别动物、车辆、树木等物体。其中一种是自动检测。当我把图像交给网络时,它预测为自动。但是我需要在对象周围画一个边界框。当我尝试滑动窗口方式时,我得到了很多边界框,但我只需要一个。如何在神经网络预测后找到最合适的对象边界框??我们不需要一些方法来定位大图像中的物体吗?这就是我想要的 我的最后一层函数是逻辑回归函数,它只预测1或0。我不知道如何预测概率分数。如果我对每个框都有一个概率分数,那么就很容易找到最合适的框。请给我建议一些找到相同的方法。提前谢谢。欢迎所有答案

我正在研究一种卷积神经网络,用于识别动物、车辆、树木等物体。其中一种是自动检测。当我把图像交给网络时,它预测为自动。但是我需要在对象周围画一个边界框。当我尝试滑动窗口方式时,我得到了很多边界框,但我只需要一个。如何在神经网络预测后找到最合适的对象边界框??我们不需要一些方法来定位大图像中的物体吗?这就是我想要的

我的最后一层函数是逻辑回归函数,它只预测1或0。我不知道如何预测概率分数。如果我对每个框都有一个概率分数,那么就很容易找到最合适的框。请给我建议一些找到相同的方法。提前谢谢。欢迎所有答案


不清楚输入图像中是有一个对象还是有几个对象。你的例子说明了一个问题

如果您有<强> > <强>对象,这里有一些对边框考虑的选项:

  • 保留最远的边界:保留距离所有边界框中心最远的顶部、底部、右侧和左侧边界
  • 保持平均值:例如,取所有顶部边界并保持其平均位置。对所有底部、右侧和左侧边界重复相同的操作
  • 保留中间值:与平均值相同,但保留每个方向边界的中间值
  • 保留激活最大的边界框:使用逻辑回归作为最后一步,找到进入该逻辑层的输入,并保留逻辑层输入最大的边界框

输入图像中只有一辆汽车还是多辆汽车?现在,我只有一辆汽车,但我以后还需要处理多个对象。谢谢Justas。这是一个有用的信息。最初,我计划检测一辆车,但后来我需要处理复杂的图像,如单一图像中的多种类型的车辆。因此,我需要在每辆车周围画一个边界框,还需要检测车辆的类型。。我读了那些报纸,都很好。谢谢你的来信。