Apache spark KMeans中的sparkml预测_Apache Spark_K Means_Apache Spark Mllib_Apache Spark Ml

Apache spark KMeans中的sparkml预测

apache-spark

Apache spark KMeans中的sparkml预测,apache-spark,k-means,apache-spark-mllib,apache-spark-ml,Apache Spark,K Means,Apache Spark Mllib,Apache Spark Ml,我使用Spark ML方法创建了一个KMeans模型 val kmeans = new KMeans() val model = kmeans.fit(df) 我把模型准备好了。但如何预测新数据点将落在哪个集群中呢。在MLlib中，model.predict（Vector）预测新数据点的集群。我在模型上看到了transform方法，但它不起作用。感谢Jacek Laskowski对Oli的澄清。现在对我来说很好。这是一个简单的错误。下面是整个代码 val conf = new SparkCon

我使用Spark ML方法创建了一个KMeans模型

val kmeans = new KMeans()
val model = kmeans.fit(df)

我把模型准备好了。但如何预测新数据点将落在哪个集群中呢。在MLlib中，

model.predict（Vector）

预测新数据点的集群。我在模型上看到了

transform

方法，但它不起作用。

感谢Jacek Laskowski对Oli的澄清。现在对我来说很好。这是一个简单的错误。下面是整个代码

val conf = new SparkConf().setMaster("local").setAppName("ml Kmeans")
val spark = SparkSession.builder().config(conf).getOrCreate()
import spark.implicits._
val trainingData = spark.read.json(spark.sparkContext.wholeTextFiles("file:/home/iot/data/traingJson.json").values)
val parsedData = trainingData.select("value.humidity", "value.speed", "value.temperature", "value.vibration")
val assembler = new VectorAssembler().setInputCols(Array("humidity", "speed", "temperature", "vibration")).setOutputCol("features")
val df = assembler.transform(parsedData)
val kmeans = new KMeans()
val model = kmeans.fit(df)
model.write.save("file:/home/iot/data/model1")
//--------------------------------Testing the Model------------------------
val uploadModel=KMeansModel.load("file:/home/iot/data/model1")
val testData = spark.read.json(spark.sparkContext.wholeTextFiles("file:/home/iot/data/testJson.json").values).select("value.humidity", "value.speed", "value.temperature", "value.vibration")
 val assembler=new VectorAssembler().setInputCols(Array("humidity","speed","temperature","vibration")).setOutputCol("features")
 val df = assembler.transform(testData)
model.transform(df).show(false)

你能详细说明什么是“不起作用”吗？