Python 基于Knn的名称匹配无监督学习

Python 基于Knn的名称匹配无监督学习,python,knn,Python,Knn,我正在研究一个使用合成数据的名称匹配问题,例如 alertname custname 0 wlison wilson 1 dais said 2 4dams adams 3 ad4ms adams 4 ad48s adams 5 smyth smith 6 smythe smith 7 gillan gillan 8 gilen gillan 9 scott-smith scottsmith 10 scott smit

我正在研究一个使用合成数据的名称匹配问题,例如

alertname   custname
0   wlison  wilson
1   dais    said
2   4dams   adams
3   ad4ms   adams
4   ad48s   adams
5   smyth   smith
6   smythe  smith
7   gillan  gillan
8   gilen   gillan
9   scott-smith scottsmith
10  scott smith scottsmith
11  perrson person
12  persson person

现在我想以无监督的方式将Knn应用于此任务,因为我没有任何明确的标签。我想为每一行输出匹配的分数。我已经使用了模糊匹配,现在只想探索knn的一些自动化。如果有人能提供起点,我将不胜感激。话虽如此,我们这里没有外部标签

你不可能知道KNN是一种有监督的学习技术。您可以尝试对itI进行K-means聚类,我已经对此进行了探索。人们似乎以无监督的方式应用Knn。甚至scikit库文档也表明Knn可用于无监督学习。在评论某件事之前,请先确认一下。