Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/database/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Database 当k>;铲斗尺寸_Database_Postgresql_Computer Science_Nearest Neighbor_Locality Sensitive Hash - Fatal编程技术网

Database 当k>;铲斗尺寸

Database 当k>;铲斗尺寸,database,postgresql,computer-science,nearest-neighbor,locality-sensitive-hash,Database,Postgresql,Computer Science,Nearest Neighbor,Locality Sensitive Hash,我一直在阅读有关位置敏感哈希的文献,我认为我对它的工作原理有很好的理解。考虑到单个哈希表的最简单情况,其中每个文档仅位于一个bucket中,我的问题是: 如果k大于该存储桶中的文档数,如何找到k个最近邻? 我已经看到了几种实现这一点的方法。有些人用的是a。其他人则根据自己的喜好对所有的桶进行分类 我的限制: 我的文档ID存储在PostgreSQL中,与它们各自的存储桶一起。用全表扫描来计算每个桶的汉明距离是不可行的(我有数亿个文档)。我的bucket散列很可能是24位或32位(除非有反对意见)。

我一直在阅读有关位置敏感哈希的文献,我认为我对它的工作原理有很好的理解。考虑到单个哈希表的最简单情况,其中每个文档仅位于一个bucket中,我的问题是:

如果k大于该存储桶中的文档数,如何找到k个最近邻?

我已经看到了几种实现这一点的方法。有些人用的是a。其他人则根据自己的喜好对所有的桶进行分类

我的限制:

我的文档ID存储在PostgreSQL中,与它们各自的存储桶一起。用全表扫描来计算每个桶的汉明距离是不可行的(我有数亿个文档)。我的bucket散列很可能是24位或32位(除非有反对意见)。是否有人对如何进行有经验或建议的方法