Database 当k>;铲斗尺寸
我一直在阅读有关位置敏感哈希的文献,我认为我对它的工作原理有很好的理解。考虑到单个哈希表的最简单情况,其中每个文档仅位于一个bucket中,我的问题是: 如果k大于该存储桶中的文档数,如何找到k个最近邻? 我已经看到了几种实现这一点的方法。有些人用的是a。其他人则根据自己的喜好对所有的桶进行分类 我的限制: 我的文档ID存储在PostgreSQL中,与它们各自的存储桶一起。用全表扫描来计算每个桶的汉明距离是不可行的(我有数亿个文档)。我的bucket散列很可能是24位或32位(除非有反对意见)。是否有人对如何进行有经验或建议的方法Database 当k>;铲斗尺寸,database,postgresql,computer-science,nearest-neighbor,locality-sensitive-hash,Database,Postgresql,Computer Science,Nearest Neighbor,Locality Sensitive Hash,我一直在阅读有关位置敏感哈希的文献,我认为我对它的工作原理有很好的理解。考虑到单个哈希表的最简单情况,其中每个文档仅位于一个bucket中,我的问题是: 如果k大于该存储桶中的文档数,如何找到k个最近邻? 我已经看到了几种实现这一点的方法。有些人用的是a。其他人则根据自己的喜好对所有的桶进行分类 我的限制: 我的文档ID存储在PostgreSQL中,与它们各自的存储桶一起。用全表扫描来计算每个桶的汉明距离是不可行的(我有数亿个文档)。我的bucket散列很可能是24位或32位(除非有反对意见)。