Image processing 对有向梯度直方图的理解

Image processing 对有向梯度直方图的理解,image-processing,computer-vision,object-detection,feature-extraction,Image Processing,Computer Vision,Object Detection,Feature Extraction,我正在学习关于HOG的知识,我从中了解它。用一个例子很好地解释了页面。我不理解这个概念,它是如何工作的 一个16×16的块有4个柱状图,这些柱状图可以连接起来形成36个柱状图 x 1元素向量,它可以像3×1向量那样归一化 标准化了 这是怎么来的,我们是怎么计算的?我们总是需要9位向量,这是强制性的吗?猪的尺寸是固定的吗 来了 我们总是需要9位向量,这是强制性的吗 不一定。Dalal和Triggs在报告中指出,当使用多达9个垃圾箱时,其应用(即行人检测)的准确度会提高,此后准确度不会进一步提高,这

我正在学习关于HOG的知识,我从中了解它。用一个例子很好地解释了页面。我不理解这个概念,它是如何工作的

一个16×16的块有4个柱状图,这些柱状图可以连接起来形成36个柱状图 x 1元素向量,它可以像3×1向量那样归一化 标准化了

这是怎么来的,我们是怎么计算的?我们总是需要9位向量,这是强制性的吗?猪的尺寸是固定的吗

来了

我们总是需要9位向量,这是强制性的吗

不一定。Dalal和Triggs在报告中指出,当使用多达9个垃圾箱时,其应用(即行人检测)的准确度会提高,此后准确度不会进一步提高,这就是为什么通常使用9个垃圾箱的原因

这个36*1是怎么来的,我们是怎么计算的

正如评论中已经指出的那样:

每个直方图有9个箱子(每个箱子都是特征向量中的标量值)。在您的示例中,直方图是使用8 x 8块计算的,这意味着在16 x 16块中,您将能够计算4个直方图。每个直方图将产生一个9x1特征向量,因此:

4(直方图)*9(箱)=36 x 1特征向量


基本上,只需将结果连接到一个向量中

8x8块创建9格柱状图。一个16x16块=4个8x8块,因此它有4个直方图,可以连接成36 x 1(9x4)。我不确定9位向量是否是必须的,但建议使用。