Apache spark 如何在Spark MLLib中进行多目标线性回归?

Apache spark 如何在Spark MLLib中进行多目标线性回归?,apache-spark,Apache Spark,Spark-ML线性回归似乎与单个标签相反 LabeledPoint(label: Double, features: Array[Double]) https://spark.apache.org/docs/0.8.1/api/mllib/org/apache/spark/mllib/regression/LabeledPoint.html 然而,对于我的问题,我需要预测一个向量 e、 g 我有办法做到这一点吗?(这在sickit learn中得到了支持,我正在spark中尝试这样做) p

Spark-ML线性回归似乎与单个标签相反

LabeledPoint(label: Double, features: Array[Double])

https://spark.apache.org/docs/0.8.1/api/mllib/org/apache/spark/mllib/regression/LabeledPoint.html
然而,对于我的问题,我需要预测一个向量

e、 g

我有办法做到这一点吗?(这在sickit learn中得到了支持,我正在spark中尝试这样做)

ps 1:如果不能直接在MLLib中实现这一点,是否有关于如何使用spark从头开始实现这一点的教程


ps 2:我的输出标签是一个60元素的向量。所以我可以进行60次线性回归,然后进行60次预测。但这看起来像是一个黑客

据我所知,没有本机实现,但如果您查看scikit学习实现,就会发现“战略包括为每个目标安装一个回归器。由于每个目标仅由一个回归器表示,因此可以通过检查其相应的回归器来获得有关目标的知识”


这意味着一个潜在的实现可能是对每个目标的回归步骤进行并行化。然后,您可以同时分配计算以加快速度。

据我所知,没有本地实现,但如果您查看scikit learn实现,它说“策略包括为每个目标装配一个回归器。由于每个目标仅由一个回归器表示,因此可以通过检查其相应的回归器来获得有关目标的知识”


这意味着一个潜在的实现可能是为每个目标并行化回归步骤。然后,您可以同时分配计算以加快速度。

您找到问题的解决方案了吗?您找到问题的解决方案了吗?
LabeledPoint(label: Array[Double], features: Array[Double])