Audio 基于音频指纹的位置敏感哈希算法

Audio 基于音频指纹的位置敏感哈希算法,audio,hash,audio-fingerprinting,locality-sensitive-hash,Audio,Hash,Audio Fingerprinting,Locality Sensitive Hash,我正在开发音频指纹识别系统,最近阅读了一些论文和研究,特别是本页: 我现在每32ms的音频就有一系列指纹。我想做的是使用LSH或其他相似性保持方法对这些单独的指纹(而不是它们的序列)进行散列。根据我对LSH的理解,它处理多维向量并生成二进制字符串,然后可以在汉明空间中进行比较 我的问题是我的指纹不是多维的。它们只是单个长整数。如何使用LSH对这些进行哈希?有什么方法可以散列(以保持相似性的方式)一维标量吗?回复得很晚,但问题是,它确实很简单,但不知道我怎么会错过它 LSH将使用随机投影向量将向量

我正在开发音频指纹识别系统,最近阅读了一些论文和研究,特别是本页:

我现在每32ms的音频就有一系列指纹。我想做的是使用LSH或其他相似性保持方法对这些单独的指纹(而不是它们的序列)进行散列。根据我对LSH的理解,它处理多维向量并生成二进制字符串,然后可以在汉明空间中进行比较


我的问题是我的指纹不是多维的。它们只是单个长整数。如何使用LSH对这些进行哈希?有什么方法可以散列(以保持相似性的方式)一维标量吗?

回复得很晚,但问题是,它确实很简单,但不知道我怎么会错过它

LSH将使用随机投影向量将向量或标量投影到不同的维度空间,同时保持相似性。在这里检查一个好的答案

所以我所要做的就是创建一个阶为[nx1]的随机投影矩阵,然后将它与标量[1x1]或标量[1xm]的向量相乘,得到投影[nx1]或[nxm]。此后,对其进行阈值化以获得二进制向量似乎就是这样

虽然我相信这是正确的方法(以前也用同样的方法),但到目前为止,我似乎还不能得到好的二进制向量。当我对这个问题有更深入的了解时,我可能会发布另一个问题