Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/image-processing/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Image processing 为什么要在面片而不是整个图像上提取SIFT特征?_Image Processing_Sift - Fatal编程技术网

Image processing 为什么要在面片而不是整个图像上提取SIFT特征?

Image processing 为什么要在面片而不是整个图像上提取SIFT特征?,image-processing,sift,Image Processing,Sift,有些人从图像的面片中提取SIFT特征,例如“在16×16像素的面片上计算128维SIFT描述符,在水平和垂直方向上以8像素的规则间距在网格上密集采样” 为什么他们不直接从原始图像中提取SIFT?像这样从原始图像的补丁中提取SIFT有什么好处 谢谢 首先,我想说SIFT特征是一个128维的描述符。使用包含实际关注点(从狗身上获得的极值)的16x16邻域计算128个维度。那是相当具体的() 目标部分是为什么他们会在规则8x8间距的网格上采样?我能想到的唯一原因是真正减少计算时间 创建已知数量的描述符

有些人从图像的面片中提取SIFT特征,例如“在16×16像素的面片上计算128维SIFT描述符,在水平和垂直方向上以8像素的规则间距在网格上密集采样”

为什么他们不直接从原始图像中提取SIFT?像这样从原始图像的补丁中提取SIFT有什么好处


谢谢

首先,我想说SIFT特征是一个128维的描述符。使用包含实际关注点(从狗身上获得的极值)的16x16邻域计算128个维度。那是相当具体的()

目标部分是为什么他们会在规则8x8间距的网格上采样?我能想到的唯一原因是真正减少计算时间

  • 创建已知数量的描述符。如果图像是MxN,那么在整个图像上运行SIFT的描述符数量=(M/8)x(N/8)可能会产生许多聚集在一起的描述符。并且可能是无限的。由于每个描述符的计算成本都很高,因此减少该数目将减少计算时间。即使是一个小的100x100图像也可能有数百个描述符。这种方法可以将其减少到约144

  • 寻找关键点本身实际上是一项密集的任务。它包括检查狗金字塔的每个体素,以及检查以体素为中心的极值(最大值或最小值)(对于狗的每个倍频程和每3个刻度)。如果您可以跳过这一步,只需假设每个8x8栅格间距,就可以省去整个狗和所有八度音阶和音阶的昂贵操作


  • 同样,这些只是我的观点,但我希望它能帮助你解决一点我的图像处理问题,我需要在算法忽略的图像区域中使用SIFT特征。因此,我强迫SIFT算法从图像的每个补丁中为我提供特征