Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/extjs/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Fuzzy search 最佳模糊匹配算法?_Fuzzy Search - Fatal编程技术网

Fuzzy search 最佳模糊匹配算法?

Fuzzy search 最佳模糊匹配算法?,fuzzy-search,Fuzzy Search,最好的模糊匹配算法(模糊逻辑、N-Gram、Levenstein、Soundex……)是什么,可以在更短的时间内处理100000条以上的记录 我建议你阅读维基百科文章“参考文献”部分提到的纳瓦罗的文章 . 根据实际研究做出决定总比根据随机建议好 陌生人。。尤其是当已知记录集的性能对您很重要时。这在很大程度上取决于您的数据。某些记录可以比其他记录更好地匹配。例如,邮政编码是一种已定义的格式,因此可以以不同的方式与普通字符串进行比较。人们可以在首字母和DOB或其他组合等方面进行匹配。我想@Mitch

最好的模糊匹配算法(模糊逻辑、N-Gram、Levenstein、Soundex……)是什么,可以在更短的时间内处理100000条以上的记录

我建议你阅读维基百科文章“参考文献”部分提到的纳瓦罗的文章 . 根据实际研究做出决定总比根据随机建议好
陌生人。。尤其是当已知记录集的性能对您很重要时。

这在很大程度上取决于您的数据。某些记录可以比其他记录更好地匹配。例如,邮政编码是一种已定义的格式,因此可以以不同的方式与普通字符串进行比较。人们可以在首字母和DOB或其他组合等方面进行匹配。

我想@Mitch Wheat的意思是,很难对这个问题给出明确的答案,因为最佳解决方案将严重依赖于您的输入和系统架构的特征。正如蒂姆在回答中提到的,你应该仔细阅读这些算法的优缺点,然后测试那些似乎适合你自己的算法。