Orange 我无法用橙色的kmeans重现结果

Orange 我无法用橙色的kmeans重现结果,orange,Orange,我试着用相同的流程重复相同的结果,但我不明白在每种情况下结果是不同的 我描述的情况是,我有一个包含192个实例和37个特征的文件,在所有情况下都选择相同的列,并通过Median和StdDev进行预处理。它用7个主成分计算主成分分析。下面的步骤是从这个“新”数据集运行k-means算法(k介于2和8之间)。散点图显示了k=5的结果 我用我的流附加了不同的图像。 第一个是原始流(它被涂成黄色),我想在没有其他选项的情况下重复它(第二个图像) 然而,当我尝试这样做时,我看到结果是不同的(第三幅图像

我试着用相同的流程重复相同的结果,但我不明白在每种情况下结果是不同的

我描述的情况是,我有一个包含192个实例和37个特征的文件,在所有情况下都选择相同的列,并通过Median和StdDev进行预处理。它用7个主成分计算主成分分析。下面的步骤是从这个“新”数据集运行k-means算法(k介于2和8之间)。散点图显示了k=5的结果

我用我的流附加了不同的图像。

第一个是原始流(它被涂成黄色),我想在没有其他选项的情况下重复它(第二个图像)

然而,当我尝试这样做时,我看到结果是不同的(第三幅图像)。当然,颜色并不决定差异,但是簇是不同的。此外,对于不同的流量,Slhouette分数也不同。

K-means是用kmean++初始化的,我有一个问题,我是否可以“控制”它,或者初始化K-means的方法是否总是随机的。我在其他节目中看到有一个叫做种子的选项,用来控制一个实验可以重复,但我在这里没有看到这个选项或类似的东西


我想知道是否有可能在相同的流中获得相同的结果(使用k-均值)

问题的出现似乎是因为k-means小部件中没有设置随机种子。所以每次重复实验时,初始化都是不同的,而且由于数据的性质,方法的收敛方式也不同。请您将您的问题报告给。

好的,我会的。谢谢你的回答。