Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/73.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何使用R中的鲁棒种子选择算法计算初始k-均值中心?_R_Algorithm_K Means_Centroid - Fatal编程技术网

如何使用R中的鲁棒种子选择算法计算初始k-均值中心?

如何使用R中的鲁棒种子选择算法计算初始k-均值中心?,r,algorithm,k-means,centroid,R,Algorithm,K Means,Centroid,到目前为止,我使用kmeans算法()在R中进行了聚类分析。但每次运行该算法,结果都略有不同。 现在我发现这是因为kmeans算法的初始中心是随机选择的。 我还发现,有可能使用稳健的种子选择算法(也称为单遍种子选择算法或SPSS)计算初始中心,如本文所述: 我的问题是:有没有办法在R中使用这个SPSS算法 例如,通过定义kmeans()函数的中心 我找不到关于它的任何东西,我很高兴能得到任何帮助 使用随机种子有一个明显的好处。。。只要用它。。。恢复到相同的初始条件对您没有帮助它对我有帮助,因为我

到目前为止,我使用kmeans算法()在R中进行了聚类分析。但每次运行该算法,结果都略有不同。
现在我发现这是因为kmeans算法的初始中心是随机选择的。 我还发现,有可能使用稳健的种子选择算法(也称为单遍种子选择算法或SPSS)计算初始中心,如本文所述:

我的问题是:有没有办法在R中使用这个SPSS算法

例如,通过定义kmeans()函数的中心


我找不到关于它的任何东西,我很高兴能得到任何帮助

使用随机种子有一个明显的好处。。。只要用它。。。恢复到相同的初始条件对您没有帮助它对我有帮助,因为我想要一个可靠的结果,如果我在同一数据集上多次运行代码,这一点不会改变。我与非数据科学家合作使用该解决方案,在这种情况下,一个可靠的解决方案比n个类似的解决方案要好得多。如果您的问题只是重复性,那么从数据集中选择k个随机点,并将其用作初始中心。当您为随机函数提供种子时,每次在同一数据集上运行代码时,这将为您提供相同的点。谢谢Scott Stensland和SaiBot,但我正在尝试找到一种计算有用初始中心的方法。在我的问题中的链接中,你可以看到,有一些数学思想可以找到那些有用的初始中心,它甚至证明了k-均值结果在质量上有所提高。所以我寻找一种方法来计算上面的链接,或者在R中进行类似的计算,以找到可复制的初始中心。。。只要用它。。。恢复到相同的初始条件对您没有帮助它对我有帮助,因为我想要一个可靠的结果,如果我在同一数据集上多次运行代码,这一点不会改变。我与非数据科学家合作使用该解决方案,在这种情况下,一个可靠的解决方案比n个类似的解决方案要好得多。如果您的问题只是重复性,那么从数据集中选择k个随机点,并将其用作初始中心。当您为随机函数提供种子时,每次在同一数据集上运行代码时,这将为您提供相同的点。谢谢Scott Stensland和SaiBot,但我正在尝试找到一种计算有用初始中心的方法。在我的问题中的链接中,你可以看到,有一些数学思想可以找到那些有用的初始中心,它甚至证明了k-均值结果在质量上有所提高。所以我寻找一种方法来计算上面的链接,或者在R中进行类似的计算,以找到可复制的初始中心。