Orange 我无法用橙色的kmeans重现结果_Orange

Orange 我无法用橙色的kmeans重现结果

Orange 我无法用橙色的kmeans重现结果,orange,Orange,我试着用相同的流程重复相同的结果，但我不明白在每种情况下结果是不同的我描述的情况是，我有一个包含192个实例和37个特征的文件，在所有情况下都选择相同的列，并通过Median和StdDev进行预处理。它用7个主成分计算主成分分析。下面的步骤是从这个“新”数据集运行k-means算法（k介于2和8之间）。散点图显示了k=5的结果我用我的流附加了不同的图像。第一个是原始流（它被涂成黄色），我想在没有其他选项的情况下重复它（第二个图像）然而，当我尝试这样做时，我看到结果是不同的（第三幅图像

我试着用相同的流程重复相同的结果，但我不明白在每种情况下结果是不同的

我描述的情况是，我有一个包含192个实例和37个特征的文件，在所有情况下都选择相同的列，并通过Median和StdDev进行预处理。它用7个主成分计算主成分分析。下面的步骤是从这个“新”数据集运行k-means算法（k介于2和8之间）。散点图显示了k=5的结果

我用我的流附加了不同的图像。

第一个是原始流（它被涂成黄色），我想在没有其他选项的情况下重复它（第二个图像）

然而，当我尝试这样做时，我看到结果是不同的（第三幅图像）。当然，颜色并不决定差异，但是簇是不同的。此外，对于不同的流量，Slhouette分数也不同。

K-means是用kmean++初始化的，我有一个问题，我是否可以“控制”它，或者初始化K-means的方法是否总是随机的。我在其他节目中看到有一个叫做种子的选项，用来控制一个实验可以重复，但我在这里没有看到这个选项或类似的东西

我想知道是否有可能在相同的流中获得相同的结果（使用k-均值）

问题的出现似乎是因为k-means小部件中没有设置随机种子。所以每次重复实验时，初始化都是不同的，而且由于数据的性质，方法的收敛方式也不同。请您将您的问题报告给。

好的，我会的。谢谢你的回答。