Image processing 为什么要在面片而不是整个图像上提取SIFT特征？_Image Processing_Sift

Image processing 为什么要在面片而不是整个图像上提取SIFT特征？

image-processing

Image processing 为什么要在面片而不是整个图像上提取SIFT特征？,image-processing,sift,Image Processing,Sift,有些人从图像的面片中提取SIFT特征，例如“在16×16像素的面片上计算128维SIFT描述符，在水平和垂直方向上以8像素的规则间距在网格上密集采样” 为什么他们不直接从原始图像中提取SIFT？像这样从原始图像的补丁中提取SIFT有什么好处谢谢首先，我想说SIFT特征是一个128维的描述符。使用包含实际关注点（从狗身上获得的极值）的16x16邻域计算128个维度。那是相当具体的（）目标部分是为什么他们会在规则8x8间距的网格上采样？我能想到的唯一原因是真正减少计算时间创建已知数量的描述符

有些人从图像的面片中提取SIFT特征，例如“在16×16像素的面片上计算128维SIFT描述符，在水平和垂直方向上以8像素的规则间距在网格上密集采样”

为什么他们不直接从原始图像中提取SIFT？像这样从原始图像的补丁中提取SIFT有什么好处

谢谢

首先，我想说SIFT特征是一个128维的描述符。使用包含实际关注点（从狗身上获得的极值）的16x16邻域计算128个维度。那是相当具体的（）

目标部分是为什么他们会在规则8x8间距的网格上采样？我能想到的唯一原因是真正减少计算时间

创建已知数量的描述符。如果图像是MxN，那么在整个图像上运行SIFT的描述符数量=（M/8）x（N/8）可能会产生许多聚集在一起的描述符。并且可能是无限的。由于每个描述符的计算成本都很高，因此减少该数目将减少计算时间。即使是一个小的100x100图像也可能有数百个描述符。这种方法可以将其减少到约144

寻找关键点本身实际上是一项密集的任务。它包括检查狗金字塔的每个体素，以及检查以体素为中心的极值（最大值或最小值）（对于狗的每个倍频程和每3个刻度）。如果您可以跳过这一步，只需假设每个8x8栅格间距，就可以省去整个狗和所有八度音阶和音阶的昂贵操作

同样，这些只是我的观点，但我希望它能帮助你解决一点我的图像处理问题，我需要在算法忽略的图像区域中使用SIFT特征。因此，我强迫SIFT算法从图像的每个补丁中为我提供特征