Python 需要比较K-均值聚类的相似性

Python 需要比较K-均值聚类的相似性,python,algorithm,machine-learning,cluster-computing,k-means,Python,Algorithm,Machine Learning,Cluster Computing,K Means,我需要比较聚类的相似性,但是聚类技术产生的聚类长度不相等 假设我有4个数据点A、B、C和D,并假设这些数据集是一段时间内的变化。我在第一个小时内对这些数据运行KMeans聚类,得到3个聚类[(A,B),(C),(D)]。然后在第二个小时再次对这些数据运行KMeans聚类,得到另外3个聚类[(B,C),(A),(D)],依此类推 我需要通过比较第一个小时和第二个小时内的聚类,来衡量这些聚类随时间的变化,并分配相似性分数 例如: 第一个小时内的第三个集群与第二个小时内的第三个集群更为相似,100%,

我需要比较聚类的相似性,但是聚类技术产生的聚类长度不相等

假设我有4个数据点A、B、C和D,并假设这些数据集是一段时间内的变化。我在第一个小时内对这些数据运行KMeans聚类,得到3个聚类[(A,B),(C),(D)]。然后在第二个小时再次对这些数据运行KMeans聚类,得到另外3个聚类[(B,C),(A),(D)],依此类推

我需要通过比较第一个小时和第二个小时内的聚类,来衡量这些聚类随时间的变化,并分配相似性分数

例如:

第一个小时内的第三个集群与第二个小时内的第三个集群更为相似,100%,这里没有问题,但问题是我如何测量其他集群

1-(A,B)一起开始,然后分散,如果所述(A,B)与(B,C)类似,具有50%

2-我将无法在(a,B)和(a)和(C)之间分配分数,因为它们的长度不同,如果按照计算它们的方法,我将得到多个类似的分数


如果有人有解决此问题的想法。

检查此想法是否有效: 1-运行k-mean聚类并在任意时间段内保存质心 2-通过测量质心的移动,您可以每小时进行比较

希望能有帮助