Machine learning 神经网络输出中的包围盒估计
我正在研究一种卷积神经网络,用于识别动物、车辆、树木等物体。其中一种是自动检测。当我把图像交给网络时,它预测为自动。但是我需要在对象周围画一个边界框。当我尝试滑动窗口方式时,我得到了很多边界框,但我只需要一个。如何在神经网络预测后找到最合适的对象边界框??我们不需要一些方法来定位大图像中的物体吗?这就是我想要的 我的最后一层函数是逻辑回归函数,它只预测1或0。我不知道如何预测概率分数。如果我对每个框都有一个概率分数,那么就很容易找到最合适的框。请给我建议一些找到相同的方法。提前谢谢。欢迎所有答案Machine learning 神经网络输出中的包围盒估计,machine-learning,neural-network,conv-neural-network,Machine Learning,Neural Network,Conv Neural Network,我正在研究一种卷积神经网络,用于识别动物、车辆、树木等物体。其中一种是自动检测。当我把图像交给网络时,它预测为自动。但是我需要在对象周围画一个边界框。当我尝试滑动窗口方式时,我得到了很多边界框,但我只需要一个。如何在神经网络预测后找到最合适的对象边界框??我们不需要一些方法来定位大图像中的物体吗?这就是我想要的 我的最后一层函数是逻辑回归函数,它只预测1或0。我不知道如何预测概率分数。如果我对每个框都有一个概率分数,那么就很容易找到最合适的框。请给我建议一些找到相同的方法。提前谢谢。欢迎所有答案
不清楚输入图像中是有一个对象还是有几个对象。你的例子说明了一个问题
如果您有<强> > <强>对象,这里有一些对边框考虑的选项:
- 保留最远的边界:保留距离所有边界框中心最远的顶部、底部、右侧和左侧边界
- 保持平均值:例如,取所有顶部边界并保持其平均位置。对所有底部、右侧和左侧边界重复相同的操作
- 保留中间值:与平均值相同,但保留每个方向边界的中间值
- 保留激活最大的边界框:使用逻辑回归作为最后一步,找到进入该逻辑层的输入,并保留逻辑层输入最大的边界框