Image processing LSH是关于将向量转换为汉明距离的二进制向量吗?

Image processing LSH是关于将向量转换为汉明距离的二进制向量吗?,image-processing,sift,nearest-neighbor,orb,locality-sensitive-hash,Image Processing,Sift,Nearest Neighbor,Orb,Locality Sensitive Hash,我读了一些关于LSH的文章,我知道它是用来解决近似k-NN问题的。我们可以将算法分为两部分: 给定D维度(其中D较大)中任意值的向量,用一组N(其中N1)对其进行翻译。您可以绕过它,但随后将在D维度中工作,而不是您所说的N。其中N,但引用的文本仅引用一个描述符。这意味着在SIFT中,每个描述符都是128维的向量。但是图像是由多个描述符表示的,这就是为什么我说图像是通过矩阵表示的,因为我需要多个向量描述符(每个描述符都是128维的)。然后通过识别它们的最近邻来匹配两个图像之间的关键点。从我提供的链

我读了一些关于LSH的文章,我知道它是用来解决近似k-NN问题的。我们可以将算法分为两部分:


  • 给定
    D
    维度(其中
    D
    较大)中任意值的向量,用一组
    N
    (其中
    N1)对其进行翻译。您可以绕过它,但随后将在
    D
    维度中工作,而不是您所说的
    N
    。其中
    N,但引用的文本仅引用一个描述符。这意味着在SIFT中,每个描述符都是128维的向量。但是图像是由多个描述符表示的,这就是为什么我说图像是通过矩阵表示的,因为我需要多个向量描述符(每个描述符都是128维的)。然后通过识别它们的最近邻来匹配两个图像之间的
    关键点。
    从我提供的链接,应该有帮助@justHelloWorld。现在更清楚了:我们在LSH中的研究只基于整个图像中可用的多个描述符中的一个描述符。因此,我们通过一个描述符相对于图像中的一个小面片来识别一幅图像。现在我想知道我们如何在图像中提取一个有意义(或者更好,最有意义)的补丁,但我想我会在这个主题上提出另一个问题:)正是@justHelloWorld,你明白了!嗯,这是一个大问题,许多科学家正在研究它,我想这是一个开放的问题。我刚刚发现GIST描述符指的是整个图像,而不仅仅是其中的一个补丁/关键点,因此我们可以通过向量来表示图像(534维,如果我没有错的话)。这太棒了:)