Machine learning 神经网络输出中的包围盒估计_Machine Learning_Neural Network_Conv Neural Network

Machine learning 神经网络输出中的包围盒估计

machine-learning neural-network

Machine learning 神经网络输出中的包围盒估计,machine-learning,neural-network,conv-neural-network,Machine Learning,Neural Network,Conv Neural Network,我正在研究一种卷积神经网络，用于识别动物、车辆、树木等物体。其中一种是自动检测。当我把图像交给网络时，它预测为自动。但是我需要在对象周围画一个边界框。当我尝试滑动窗口方式时，我得到了很多边界框，但我只需要一个。如何在神经网络预测后找到最合适的对象边界框？？我们不需要一些方法来定位大图像中的物体吗？这就是我想要的我的最后一层函数是逻辑回归函数，它只预测1或0。我不知道如何预测概率分数。如果我对每个框都有一个概率分数，那么就很容易找到最合适的框。请给我建议一些找到相同的方法。提前谢谢。欢迎所有答案

我正在研究一种卷积神经网络，用于识别动物、车辆、树木等物体。其中一种是自动检测。当我把图像交给网络时，它预测为自动。但是我需要在对象周围画一个边界框。当我尝试滑动窗口方式时，我得到了很多边界框，但我只需要一个。如何在神经网络预测后找到最合适的对象边界框？？我们不需要一些方法来定位大图像中的物体吗？这就是我想要的

我的最后一层函数是逻辑回归函数，它只预测1或0。我不知道如何预测概率分数。如果我对每个框都有一个概率分数，那么就很容易找到最合适的框。请给我建议一些找到相同的方法。提前谢谢。欢迎所有答案

不清楚输入图像中是有一个对象还是有几个对象。你的例子说明了一个问题

如果您有<强> > <强>对象，这里有一些对边框考虑的选项：

保留最远的边界：保留距离所有边界框中心最远的顶部、底部、右侧和左侧边界
保持平均值：例如，取所有顶部边界并保持其平均位置。对所有底部、右侧和左侧边界重复相同的操作
保留中间值：与平均值相同，但保留每个方向边界的中间值
保留激活最大的边界框：使用逻辑回归作为最后一步，找到进入该逻辑层的输入，并保留逻辑层输入最大的边界框

输入图像中只有一辆汽车还是多辆汽车？现在，我只有一辆汽车，但我以后还需要处理多个对象。谢谢Justas。这是一个有用的信息。最初，我计划检测一辆车，但后来我需要处理复杂的图像，如单一图像中的多种类型的车辆。因此，我需要在每辆车周围画一个边界框，还需要检测车辆的类型。。我读了那些报纸，都很好。谢谢你的来信。