Image processing 多尺度方向梯度直方图(均值漂移?)
我正在研究HOG描述符,除了检测窗口的融合之外,我几乎已经完成了大部分部分 到目前为止,我所做的是;我构建了一个图像的比例空间金字塔,对于每个比例上的每个图像,我移动检测窗口(64x128)并检测人类。在每个图像中,一个人被多个窗口检测到 所以问题是如何将所有这些窗口(假设为一个人)融合到一个窗口中。Dalal建议人们应该使用一种稳健的mod检测算法,比如meanshift。但是,我有多个音阶。。。为了实现这一点,我是否应该首先估计在较低级别的比例空间中发现的检测窗口的真实位置 感谢您的帮助。Image processing 多尺度方向梯度直方图(均值漂移?),image-processing,computer-vision,object-detection,Image Processing,Computer Vision,Object Detection,我正在研究HOG描述符,除了检测窗口的融合之外,我几乎已经完成了大部分部分 到目前为止,我所做的是;我构建了一个图像的比例空间金字塔,对于每个比例上的每个图像,我移动检测窗口(64x128)并检测人类。在每个图像中,一个人被多个窗口检测到 所以问题是如何将所有这些窗口(假设为一个人)融合到一个窗口中。Dalal建议人们应该使用一种稳健的mod检测算法,比如meanshift。但是,我有多个音阶。。。为了实现这一点,我是否应该首先估计在较低级别的比例空间中发现的检测窗口的真实位置 感谢您的帮助。
提前谢谢。我的解释是,平均值的改变实际上会给你你所建议的 基本上,您首先根据检测器输出的强度以最粗略的尺度估计人员位置的概率分布。这将为您提供模式的稳健估计 然后,您可以使用围绕最大值或模式的更精细比例进行迭代优化 例如,这个想法与金字塔LK跟踪非常相似。还可以执行集合处理和/或粒子过滤器