Audio 基于音频指纹的位置敏感哈希算法_Audio_Hash_Audio Fingerprinting_Locality Sensitive Hash

Audio 基于音频指纹的位置敏感哈希算法

audio hash

Audio 基于音频指纹的位置敏感哈希算法,audio,hash,audio-fingerprinting,locality-sensitive-hash,Audio,Hash,Audio Fingerprinting,Locality Sensitive Hash,我正在开发音频指纹识别系统，最近阅读了一些论文和研究，特别是本页：我现在每32ms的音频就有一系列指纹。我想做的是使用LSH或其他相似性保持方法对这些单独的指纹（而不是它们的序列）进行散列。根据我对LSH的理解，它处理多维向量并生成二进制字符串，然后可以在汉明空间中进行比较我的问题是我的指纹不是多维的。它们只是单个长整数。如何使用LSH对这些进行哈希？有什么方法可以散列（以保持相似性的方式）一维标量吗？回复得很晚，但问题是，它确实很简单，但不知道我怎么会错过它 LSH将使用随机投影向量将向量

我正在开发音频指纹识别系统，最近阅读了一些论文和研究，特别是本页：

我现在每32ms的音频就有一系列指纹。我想做的是使用LSH或其他相似性保持方法对这些单独的指纹（而不是它们的序列）进行散列。根据我对LSH的理解，它处理多维向量并生成二进制字符串，然后可以在汉明空间中进行比较

我的问题是我的指纹不是多维的。它们只是单个长整数。如何使用LSH对这些进行哈希？有什么方法可以散列（以保持相似性的方式）一维标量吗？

回复得很晚，但问题是，它确实很简单，但不知道我怎么会错过它

LSH将使用随机投影向量将向量或标量投影到不同的维度空间，同时保持相似性。在这里检查一个好的答案

所以我所要做的就是创建一个阶为[nx1]的随机投影矩阵，然后将它与标量[1x1]或标量[1xm]的向量相乘，得到投影[nx1]或[nxm]。此后，对其进行阈值化以获得二进制向量似乎就是这样

虽然我相信这是正确的方法（以前也用同样的方法），但到目前为止，我似乎还不能得到好的二进制向量。当我对这个问题有更深入的了解时，我可能会发布另一个问题