Python Pyspark ML KMean有办法得到解释的方差吗?

Python Pyspark ML KMean有办法得到解释的方差吗?,python,pyspark,k-means,Python,Pyspark,K Means,当我阅读Pyspark的ML包时,KMeanModel似乎没有一种方法来计算解释的方差,以便绘制弯头曲线,以确定最佳的聚类数 然而,在示例中,用户似乎有一个computeCost()函数。这个功能是从哪里来的?我的计划没有成功 我使用的是Spark 1.6。提前谢谢 关于pyspark中的computcost方法,我也遇到了同样的问题 在应用kmeans后,您可以使用马氏距离或WSSE,而不是使用computecost 要计算距离,您必须编写代码并获得 您可以绘制各种结果图,以查看其拐点 最佳聚

当我阅读Pyspark的ML包时,KMeanModel似乎没有一种方法来计算解释的方差,以便绘制弯头曲线,以确定最佳的聚类数

然而,在示例中,用户似乎有一个
computeCost()
函数。这个功能是从哪里来的?我的计划没有成功


我使用的是Spark 1.6。提前谢谢

关于pyspark中的computcost方法,我也遇到了同样的问题

在应用kmeans后,您可以使用马氏距离或WSSE,而不是使用computecost

要计算距离,您必须编写代码并获得 您可以绘制各种结果图,以查看其拐点 最佳聚类数


这个用例帮助我看了一下

感谢您提供的信息,computecost是否可用>2.0?我继续并实现了我自己的。