Python 如何将CSV数据转换为标签点格式?
在这里提供的示例中,数据已经是LabelledPoint格式,但我有一个csv文件,其中有单独的标签列和要素列(它们都是文本) 没有直接的方法将CSV转换为标签点 这是我通常使用的代码:Python 如何将CSV数据转换为标签点格式?,python,apache-spark,pyspark,Python,Apache Spark,Pyspark,在这里提供的示例中,数据已经是LabelledPoint格式,但我有一个csv文件,其中有单独的标签列和要素列(它们都是文本) 没有直接的方法将CSV转换为标签点 这是我通常使用的代码: val csv = sc.textFile("PATH/TO/CSVFILE") val lPoint = csv.map { line => val values = line.split(",").map(_.toDouble) val features = Vectors.dense(va
val csv = sc.textFile("PATH/TO/CSVFILE")
val lPoint = csv.map { line =>
val values = line.split(",").map(_.toDouble)
val features = Vectors.dense(values.init)
//Assuming that the label is always in the last column.
val label = values.last
LabeledPoint(label, features)
}
这是在Scala中,而最初的问题是询问Python实现