Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/scala/18.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
制造Spark'缺少什么重要功能;s MLlib线性回归在Scala中的示例工作?_Scala_Apache Spark - Fatal编程技术网

制造Spark'缺少什么重要功能;s MLlib线性回归在Scala中的示例工作?

制造Spark'缺少什么重要功能;s MLlib线性回归在Scala中的示例工作?,scala,apache-spark,Scala,Apache Spark,使用Spark v1.0-rc3-当实现MLlib的线性回归时,我得到一个错误。因此,最终我尝试从中复制/粘贴Scala中的线性回归,但仍然收到错误: scala>val parsedData=data.map{line=> val parts=line.split(',') 标签点(部分(0)。toDouble,部分(1)。拆分(“”)。映射(x=>x.toDouble)。toArray) } :28:错误:多态表达式无法实例化为预期类型; 找到:[U>:双]数组[U] 必需:org.apac

使用Spark v1.0-rc3-当实现MLlib的线性回归时,我得到一个错误。因此,最终我尝试从中复制/粘贴Scala中的线性回归,但仍然收到错误:

scala>val parsedData=data.map{line=>
val parts=line.split(',')
标签点(部分(0)。toDouble,部分(1)。拆分(“”)。映射(x=>x.toDouble)。toArray)
}
:28:错误:多态表达式无法实例化为预期类型;
找到:[U>:双]数组[U]
必需:org.apache.spark.mllib.linalg.Vector
标签点(部分(0)。toDouble,部分(1)。拆分(“”)。映射(x=>x.toDouble)。toArray)

该错误表示需要
org.apache.spark.mllib.linalg.Vector
,但导入它没有帮助。即使尝试多种方法对向量进行强制转换,我也会得到

:19:错误:类型不匹配;
找到:scala.collection.immutable.Vector[Array[Double]]

问题是由于对更高版本的更改。曾经在v0.91中运行的代码现在需要对v1.0进行调整。您可以找到解决方案,不管错误告诉您什么,都添加向量而不是向量。尝试:

import org.apache.spark.mllib.regression.LinearRegressionWithSGD
import org.apache.spark.mllib.regression.LabeledPoint
import org.apache.spark.mllib.linalg.Vectors

// Load and parse the data
val data = sc.textFile("mllib/data/ridge-data/lpsa.data")
val parsedData = data.map { line =>
  val parts = line.split(',')
  LabeledPoint(parts(0).toDouble, Vectors.dense(parts(1).split(' ').map(x => x.toDouble)))
  }