Python 需要比较K-均值聚类的相似性_Python_Algorithm_Machine Learning_Cluster Computing_K Means

Python 需要比较K-均值聚类的相似性

python algorithm machine-learning cluster-computing

Python 需要比较K-均值聚类的相似性,python,algorithm,machine-learning,cluster-computing,k-means,Python,Algorithm,Machine Learning,Cluster Computing,K Means,我需要比较聚类的相似性，但是聚类技术产生的聚类长度不相等假设我有4个数据点A、B、C和D，并假设这些数据集是一段时间内的变化。我在第一个小时内对这些数据运行KMeans聚类，得到3个聚类[（A，B），（C），（D）]。然后在第二个小时再次对这些数据运行KMeans聚类，得到另外3个聚类[（B，C），（A），（D）]，依此类推我需要通过比较第一个小时和第二个小时内的聚类，来衡量这些聚类随时间的变化，并分配相似性分数例如：第一个小时内的第三个集群与第二个小时内的第三个集群更为相似，100%，

我需要比较聚类的相似性，但是聚类技术产生的聚类长度不相等

假设我有4个数据点A、B、C和D，并假设这些数据集是一段时间内的变化。我在第一个小时内对这些数据运行KMeans聚类，得到3个聚类[（A，B），（C），（D）]。然后在第二个小时再次对这些数据运行KMeans聚类，得到另外3个聚类[（B，C），（A），（D）]，依此类推

我需要通过比较第一个小时和第二个小时内的聚类，来衡量这些聚类随时间的变化，并分配相似性分数

例如：

第一个小时内的第三个集群与第二个小时内的第三个集群更为相似，100%，这里没有问题，但问题是我如何测量其他集群

1-（A，B）一起开始，然后分散，如果所述（A，B）与（B，C）类似，具有50%

2-我将无法在（a，B）和（a）和（C）之间分配分数，因为它们的长度不同，如果按照计算它们的方法，我将得到多个类似的分数

如果有人有解决此问题的想法。

检查此想法是否有效： 1-运行k-mean聚类并在任意时间段内保存质心 2-通过测量质心的移动，您可以每小时进行比较

希望能有帮助