Java 如何在新的Spark ml库中设置K-Means中的ε
在spark.mllib库中,KMeans具有在构建KMeans实例时设置epsilon参数的函数 但是我在Kmeans new Spark.ml库中没有看到设置此参数的函数。我问这个问题的原因是因为newkmeans生成的集群数量少于我在setK()方法中指定的数量,所以我想通过稍微减少epsilon来增加生成的集群数量 有人知道如何在new Spark.ml Kmeans类中设置epsilon吗Java 如何在新的Spark ml库中设置K-Means中的ε,java,apache-spark,apache-spark-ml,Java,Apache Spark,Apache Spark Ml,在spark.mllib库中,KMeans具有在构建KMeans实例时设置epsilon参数的函数 但是我在Kmeans new Spark.ml库中没有看到设置此参数的函数。我问这个问题的原因是因为newkmeans生成的集群数量少于我在setK()方法中指定的数量,所以我想通过稍微减少epsilon来增加生成的集群数量 有人知道如何在new Spark.ml Kmeans类中设置epsilon吗 org.apache.spark.ml.clustering.KMeans 谢谢。spark.m
org.apache.spark.ml.clustering.KMeans
谢谢。
spark.ml
库中的Epsilon已重命名为tol
(公差的缩写)
例如:
KMeans kmeans = new KMeans().setK(2).setSeed(1L).setTol(0.0001)
KMeansModel model = kmeans.fit(dataset);