Database 在度量空间中索引和搜索的解释良好的算法

Database 在度量空间中索引和搜索的解释良好的算法,database,algorithm,postgresql,data-mining,Database,Algorithm,Postgresql,Data Mining,我需要在Postgres(*)(PL或PL/Python)中实现某种度量空间搜索。因此,我正在寻找好的资料来源(或论文),对这些想法背后的机制有一个清晰明了的解释,这样我就可以自己实现它 我更喜欢清晰而不是效率 (*)更好地描述了这方面的需求。特别是对于地理数据,请首先查看是否需要实现任何功能。如果你这样做了,从清单中列出的论文开始 看看你的链接,你的度量空间似乎是字符串,带有某种编辑距离作为度量。下面给出了一些解决方案的一个很好但很古老的概述:;关于Citeser的相关论文也可能有用。是一种可

我需要在Postgres(*)(PL或PL/Python)中实现某种度量空间搜索。因此,我正在寻找好的资料来源(或论文),对这些想法背后的机制有一个清晰明了的解释,这样我就可以自己实现它

我更喜欢清晰而不是效率


(*)更好地描述了这方面的需求。

特别是对于地理数据,请首先查看是否需要实现任何功能。如果你这样做了,从清单中列出的论文开始


看看你的链接,你的度量空间似乎是字符串,带有某种编辑距离作为度量。下面给出了一些解决方案的一个很好但很古老的概述:;关于Citeser的相关论文也可能有用。是一种可能有用的新技术,但很多论文都很注重数学。

一些涉及空间搜索的技术可能会帮助你们爬山、神经网络训练、遗传算法和粒子群

您还需要在度量空间上定义距离度量。你这样做了吗?(&出于好奇,如果你这样做了,它是什么)

对于索引和搜索任何服从三角形不等式(包括度量空间)的内容都很有用。典型的例子是在目标的给定编辑距离内搜索字符串。我写了一篇关于这个的文章

不幸的是,在Postgres中没有内置的支持。您可以自己使用来实现它,但显然这需要大量的工作。如果不编写自己的索引而不将树存储在表中,我想不出任何实现方法,这显然不是很有效。

您可以尝试列出许多现代度量索引,包括BK树。您可以在C中找到代码来尝试不同的选择