Scikit learn 集群算法的标签输出是否按特定顺序排序?(python,scikit学习)

Scikit learn 集群算法的标签输出是否按特定顺序排序?(python,scikit学习),scikit-learn,label,cluster-analysis,mean-shift,Scikit Learn,Label,Cluster Analysis,Mean Shift,我正在使用Shift means clustering(),其中集群的标签是从以下来源获得的: 但是,不清楚集群(0,1,…)的标签是如何生成的。看起来,标签0似乎是包含更多元素的集群。这是一般规则吗 其他算法是如何工作的?这是“随机”意义上的?或者后面的算法为0集群检测更大的集群 谢谢 附言:按照这个规则订购标签很容易,我的问题更具理论性 在许多情况下,集群顺序取决于初始化。如果您提供初始值,则此顺序将保留 如果不提供此类初始值,则顺序通常基于数据顺序。例如,第一项可能属于第一个集群(在某些算

我正在使用Shift means clustering(),其中集群的标签是从以下来源获得的:

但是,不清楚集群(0,1,…)的标签是如何生成的。看起来,标签0似乎是包含更多元素的集群。这是一般规则吗

其他算法是如何工作的?这是“随机”意义上的?或者后面的算法为0集群检测更大的集群

谢谢


附言:按照这个规则订购标签很容易,我的问题更具理论性

在许多情况下,集群顺序取决于初始化。如果您提供初始值,则此顺序将保留

如果不提供此类初始值,则顺序通常基于数据顺序。例如,第一项可能属于第一个集群(在某些算法中保留噪声,如DBSCAN)

现在数量(集群大小)有一个有趣的效果:假设您的数据是随机排序的(例如,不是通过某些合成数据生成过程排序的),那么第一个元素更可能属于“最大”集群,因此即使是“随机”顺序,该集群也最有可能排在第一位


现在,在sklearn的均值漂移(我认为它在最后的赋值规则中包含了一个错误)中,作者们显然决定按“强度”排序,但我不记得在最初的论文中有这样的规则

你永远不会知道,哪个集群会得到更多的条目。这完全取决于初始初始化…所以有时0赢,有时1赢。。。