Machine learning 如何使用ApacheSpark MLlib实现小批量Kmeans?

Machine learning 如何使用ApacheSpark MLlib实现小批量Kmeans?,machine-learning,k-means,apache-spark-mllib,mini-batch,Machine Learning,K Means,Apache Spark Mllib,Mini Batch,我已经使用spark实现了Kmeans。但由于我的数据量很大,而且特性数量也很大,所以我想使用ApacheSarkMLLIB实现小批量kmeans。有没有关于如何实现它的示例或文档?下面的文章没有介绍apache spark MLlib,但它介绍了minibatch kmeans: 史高丽,大卫。“网络规模的K-均值聚类”,《第19届万维网国际会议论文集》,1177-1178。ACM,2010年

我已经使用spark实现了Kmeans。但由于我的数据量很大,而且特性数量也很大,所以我想使用ApacheSarkMLLIB实现小批量kmeans。有没有关于如何实现它的示例或文档?

下面的文章没有介绍apache spark MLlib,但它介绍了minibatch kmeans:

史高丽,大卫。“网络规模的K-均值聚类”,《第19届万维网国际会议论文集》,1177-1178。ACM,2010年