Fuzzy search 最佳模糊匹配算法?
最好的模糊匹配算法(模糊逻辑、N-Gram、Levenstein、Soundex……)是什么,可以在更短的时间内处理100000条以上的记录 我建议你阅读维基百科文章“参考文献”部分提到的纳瓦罗的文章 . 根据实际研究做出决定总比根据随机建议好Fuzzy search 最佳模糊匹配算法?,fuzzy-search,Fuzzy Search,最好的模糊匹配算法(模糊逻辑、N-Gram、Levenstein、Soundex……)是什么,可以在更短的时间内处理100000条以上的记录 我建议你阅读维基百科文章“参考文献”部分提到的纳瓦罗的文章 . 根据实际研究做出决定总比根据随机建议好 陌生人。。尤其是当已知记录集的性能对您很重要时。这在很大程度上取决于您的数据。某些记录可以比其他记录更好地匹配。例如,邮政编码是一种已定义的格式,因此可以以不同的方式与普通字符串进行比较。人们可以在首字母和DOB或其他组合等方面进行匹配。我想@Mitch
陌生人。。尤其是当已知记录集的性能对您很重要时。这在很大程度上取决于您的数据。某些记录可以比其他记录更好地匹配。例如,邮政编码是一种已定义的格式,因此可以以不同的方式与普通字符串进行比较。人们可以在首字母和DOB或其他组合等方面进行匹配。我想@Mitch Wheat的意思是,很难对这个问题给出明确的答案,因为最佳解决方案将严重依赖于您的输入和系统架构的特征。正如蒂姆在回答中提到的,你应该仔细阅读这些算法的优缺点,然后测试那些似乎适合你自己的算法。