如何使用R中的鲁棒种子选择算法计算初始k-均值中心?
到目前为止,我使用kmeans算法()在R中进行了聚类分析。但每次运行该算法,结果都略有不同。如何使用R中的鲁棒种子选择算法计算初始k-均值中心?,r,algorithm,k-means,centroid,R,Algorithm,K Means,Centroid,到目前为止,我使用kmeans算法()在R中进行了聚类分析。但每次运行该算法,结果都略有不同。 现在我发现这是因为kmeans算法的初始中心是随机选择的。 我还发现,有可能使用稳健的种子选择算法(也称为单遍种子选择算法或SPSS)计算初始中心,如本文所述: 我的问题是:有没有办法在R中使用这个SPSS算法 例如,通过定义kmeans()函数的中心 我找不到关于它的任何东西,我很高兴能得到任何帮助 使用随机种子有一个明显的好处。。。只要用它。。。恢复到相同的初始条件对您没有帮助它对我有帮助,因为我
现在我发现这是因为kmeans算法的初始中心是随机选择的。 我还发现,有可能使用稳健的种子选择算法(也称为单遍种子选择算法或SPSS)计算初始中心,如本文所述: 我的问题是:有没有办法在R中使用这个SPSS算法 例如,通过定义kmeans()函数的中心
我找不到关于它的任何东西,我很高兴能得到任何帮助 使用随机种子有一个明显的好处。。。只要用它。。。恢复到相同的初始条件对您没有帮助它对我有帮助,因为我想要一个可靠的结果,如果我在同一数据集上多次运行代码,这一点不会改变。我与非数据科学家合作使用该解决方案,在这种情况下,一个可靠的解决方案比n个类似的解决方案要好得多。如果您的问题只是重复性,那么从数据集中选择k个随机点,并将其用作初始中心。当您为随机函数提供种子时,每次在同一数据集上运行代码时,这将为您提供相同的点。谢谢Scott Stensland和SaiBot,但我正在尝试找到一种计算有用初始中心的方法。在我的问题中的链接中,你可以看到,有一些数学思想可以找到那些有用的初始中心,它甚至证明了k-均值结果在质量上有所提高。所以我寻找一种方法来计算上面的链接,或者在R中进行类似的计算,以找到可复制的初始中心。。。只要用它。。。恢复到相同的初始条件对您没有帮助它对我有帮助,因为我想要一个可靠的结果,如果我在同一数据集上多次运行代码,这一点不会改变。我与非数据科学家合作使用该解决方案,在这种情况下,一个可靠的解决方案比n个类似的解决方案要好得多。如果您的问题只是重复性,那么从数据集中选择k个随机点,并将其用作初始中心。当您为随机函数提供种子时,每次在同一数据集上运行代码时,这将为您提供相同的点。谢谢Scott Stensland和SaiBot,但我正在尝试找到一种计算有用初始中心的方法。在我的问题中的链接中,你可以看到,有一些数学思想可以找到那些有用的初始中心,它甚至证明了k-均值结果在质量上有所提高。所以我寻找一种方法来计算上面的链接,或者在R中进行类似的计算,以找到可复制的初始中心。