Algorithm 如何计算全名之间的相似性?
我有两个项目列表,应该只根据全名进行匹配。对于确切的名称,应该没有问题,但是如果全名包含缺少的或缩写的部分,例如Algorithm 如何计算全名之间的相似性?,algorithm,pattern-matching,match,similarity,Algorithm,Pattern Matching,Match,Similarity,我有两个项目列表,应该只根据全名进行匹配。对于确切的名称,应该没有问题,但是如果全名包含缺少的或缩写的部分,例如 “约翰·布莱尔·史密斯”对“约翰·B·史密斯”或 “约翰·布莱尔·史密斯”对“约翰·B·坎贝尔·史密斯” 哪种算法可用于计算加权相似性,然后根据此相似性分数从不同列表中匹配这些名称?使用字符串距离算法之一。其中有很多: 汉明距离 Levenshtein距离 Damerau-Levenshtein距离 最佳字符串对齐 还有更多 让我们在这篇关于的文章中启发自己
- “约翰·布莱尔·史密斯”对“约翰·B·史密斯”或
- “约翰·布莱尔·史密斯”对“约翰·B·坎贝尔·史密斯”
哪种算法可用于计算加权相似性,然后根据此相似性分数从不同列表中匹配这些名称?使用字符串距离算法之一。其中有很多:
- 汉明距离
- Levenshtein距离
- Damerau-Levenshtein距离
- 最佳字符串对齐
- 还有更多