Graph 在完整图上进行MST聚类（用于余弦相似性）_Graph_Nlp_Cluster Analysis_Minimum Spanning Tree

Graph 在完整图上进行MST聚类（用于余弦相似性）

graph nlp

Graph 在完整图上进行MST聚类（用于余弦相似性）,graph,nlp,cluster-analysis,minimum-spanning-tree,Graph,Nlp,Cluster Analysis,Minimum Spanning Tree,我需要对单词（比如给定的参数k）进行聚类根据它们的余弦相似性存储在数组列表中。我已经将我的所有单词作为列表中的顶点存储在一个完整的、加权的、无向的图（使用邻接列表）中，并将它们的余弦相似度值放在边上。据我所知，我需要使用MST（Kruskals算法）进行聚类过程然而，由于我的图是完全图，MST用于连接图，我有点困惑如何在完全图上使用它？或者我用完全图做错事了这是我的词表： [directors, producers, film, movie, black, white, man, wom

我需要对单词（比如给定的参数k）进行聚类根据它们的余弦相似性存储在数组列表中。我已经将我的所有单词作为列表中的顶点存储在一个完整的、加权的、无向的图（使用邻接列表）中，并将它们的余弦相似度值放在边上。据我所知，我需要使用MST（Kruskals算法）进行聚类过程

然而，由于我的图是完全图，MST用于连接图，我有点困惑如何在完全图上使用它？或者我用完全图做错事了

这是我的词表：

 [directors, producers, film, movie, black, white, man, woman, person, man, young, woman, science, fiction, thrilling, realistic, lovely, stunning, criminals, zombies, father, son, girlfriend, boyfriend, nurse, soldier, professor, college]

我需要用MST对它们进行聚类，这样如果k（聚类数）是2，它将是这样的（根据它们的相似性分为2个聚类）：

在完全图上使用最小生成树是标准的

您通常会发现，对于这种情况，运行时的复杂性是单独给出的。在一个完整的图上，您可能需要检查Prim是否比Kruskal快

最小生成树聚类也称为单链路聚类，快速SLINK算法与Prim的MST算法密切相关。但是输出格式更适合聚类。

任何鼠标，这意味着，我可以使用Prim'e算法在完整图上查找mst，对吗？如果我正确回忆（您最好验证一下），它是速度更快的标准算法之一。但如果我没记错的话，它是O（n²）。但对于MST聚类，SLINK可能更好。

boyfriend,college,father,girlfriend,man,nurse,person,professor,son,woman,young
criminals,directors,fiction,film,lovely,movie,producers,science,stunning,thrilling,zombies