Search 存储并快速比较亮度直方图

Search 存储并快速比较亮度直方图,search,indexing,nosql,relational-database,histogram,Search,Indexing,Nosql,Relational Database,Histogram,我对构建一个特定于领域的图像搜索应用程序感兴趣,该应用程序能够搜索与给定图像相似的图像。用一点谷歌浏览器,我设法在这个网站上找到了问题。如果我正确理解了最高评级的答案,那么我希望通过在我的库中存储每个图像的亮度数据来实现 这一切都很好,但我需要一种快速搜索并与25000多条记录进行比较的方法。我用过PostgreSQL,所以我马上想到了它。我发现自己面临的问题是,要在3种颜色中存储256个离散可能值的亮度数据,我需要一个包含768列(r0、g0、b0、…、r255、g255、b255)的表,为了

我对构建一个特定于领域的图像搜索应用程序感兴趣,该应用程序能够搜索与给定图像相似的图像。用一点谷歌浏览器,我设法在这个网站上找到了问题。如果我正确理解了最高评级的答案,那么我希望通过在我的库中存储每个图像的亮度数据来实现

这一切都很好,但我需要一种快速搜索并与25000多条记录进行比较的方法。我用过PostgreSQL,所以我马上想到了它。我发现自己面临的问题是,要在3种颜色中存储256个离散可能值的亮度数据,我需要一个包含768列(
r0、g0、b0、…、r255、g255、b255)的表,为了有效地在所有记录中搜索相似性,我需要768个索引。我以前从未在这个级别上真正处理过大规模数据,但这个数字对我来说似乎有点难以理解(虽然我不知道,但我的经验并没有扩展到这个领域)

我的另一个想法是将亮度数据存储在一个大的文本列中(格式如下:
r0:rrr g0:ggg b0:bbb…r255:rrr g255:ggg b255:bbb
),并在该列上构建全文搜索索引,以便允许在数据中搜索类似的图像

另一种可能性是使用查询直方图和存储直方图之间的汉明距离,但我不认为可以对数据库中的所有记录快速进行


我这样做对吗?我也愿意接受任何关系数据库的替代方案,这些数据库可以在我的数据集中提供快速、实时的搜索。

看起来您正在将每个图像放入一个三维空间——您是否尝试过任何地理空间/多维查询引擎。类似的图像应该在3-space中彼此靠近,并与您的方法保持一致