Computer vision 二进制描述符用字包

Computer vision 二进制描述符用字包,computer-vision,sift,descriptor,orb,feature-descriptor,Computer Vision,Sift,Descriptor,Orb,Feature Descriptor,在图像描述符的经典文字袋范例中,我们: 为每个图像定义描述符集 我们在所有图像的所有描述符集合中使用k-means 结果,每个描述符都被分配给一个簇 我们定义“视觉词”(或者换句话说,如何通过向量表示图像):对于每个图像,我们将“视觉词”向量的i-th维度定义为属于i-th簇的描述符数量 我们获得了一个代表我们图像的k维“视觉单词”向量 这种方法非常适合复杂且昂贵的SIFT描述符……但对于二进制文件和快速描述符(如简短、ORB、BRISK或FREAK)也是一样的吗 据我所知,没有区别,但我想知道

在图像描述符的经典文字袋范例中,我们:

  • 为每个图像定义描述符集
  • 我们在所有图像的所有描述符集合中使用k-means
  • 结果,每个描述符都被分配给一个簇
  • 我们定义“视觉词”(或者换句话说,如何通过向量表示图像):对于每个图像,我们将“视觉词”向量的
    i-th
    维度定义为属于
    i-th
    簇的描述符数量
  • 我们获得了一个代表我们图像的
    k维
    “视觉单词”向量
  • 这种方法非常适合复杂且昂贵的SIFT描述符……但对于二进制文件和快速描述符(如简短、ORB、BRISK或FREAK)也是一样的吗

    据我所知,没有区别,但我想知道昂贵的
    k-means
    算法是否可以在二进制空间中有效地计算(或者是否有更好的聚类算法),或者是否有另一种方法用于具有二进制向量的单词包模型