Apache spark Kmeans+；中的initializationSteps参数究竟是什么+；在Spark MLLib中？_Apache Spark_Pyspark_Apache Spark Sql_Apache Spark Mllib

Apache spark Kmeans+；中的initializationSteps参数究竟是什么+；在Spark MLLib中？

apache-spark pyspark

Apache spark Kmeans+；中的initializationSteps参数究竟是什么+；在Spark MLLib中？,apache-spark,pyspark,apache-spark-sql,apache-spark-mllib,Apache Spark,Pyspark,Apache Spark Sql,Apache Spark Mllib,我知道什么是k-means，我也知道什么是k-means++算法。我相信唯一的变化是初始K中心的发现方式在++版本中，我们首先选择一个中心，然后使用概率分布选择剩余的k-1中心在k-means的MLLib算法中，初始化步骤参数是什么？准确地说，k-means++是一种选择初始中心的算法，它没有描述整个训练过程 MLLib k-means用于初始化，这是++的一个分布式变体。它不是对一个点采样，而是对迭代次数的多个点采样 initializationSteps对应于迭代次数，根据迭代次数，应大

我知道什么是k-means，我也知道什么是k-means++算法。我相信唯一的变化是初始K中心的发现方式

在++版本中，我们首先选择一个中心，然后使用概率分布选择剩余的k-1中心

在k-means的MLLib算法中，

初始化步骤

参数是什么？

准确地说，k-means++是一种选择初始中心的算法，它没有描述整个训练过程

MLLib k-means用于初始化，这是++的一个分布式变体。它不是对一个点采样，而是对迭代次数的多个点采样

initializationSteps

对应于迭代次数，根据迭代次数，应大致为O（logn）