Apache spark 如何在Spark MLLib中进行多目标线性回归？_Apache Spark

Apache spark 如何在Spark MLLib中进行多目标线性回归？

apache-spark

Apache spark 如何在Spark MLLib中进行多目标线性回归？,apache-spark,Apache Spark,Spark-ML线性回归似乎与单个标签相反 LabeledPoint(label: Double, features: Array[Double]) https://spark.apache.org/docs/0.8.1/api/mllib/org/apache/spark/mllib/regression/LabeledPoint.html 然而，对于我的问题，我需要预测一个向量 e、 g 我有办法做到这一点吗？（这在sickit learn中得到了支持，我正在spark中尝试这样做） p

Spark-ML线性回归似乎与单个标签相反

LabeledPoint(label: Double, features: Array[Double])

https://spark.apache.org/docs/0.8.1/api/mllib/org/apache/spark/mllib/regression/LabeledPoint.html

然而，对于我的问题，我需要预测一个向量

e、 g

我有办法做到这一点吗？（这在sickit learn中得到了支持，我正在spark中尝试这样做）

ps 1：如果不能直接在MLLib中实现这一点，是否有关于如何使用spark从头开始实现这一点的教程

ps 2：我的输出标签是一个60元素的向量。所以我可以进行60次线性回归，然后进行60次预测。但这看起来像是一个黑客

据我所知，没有本机实现，但如果您查看scikit学习实现，就会发现“战略包括为每个目标安装一个回归器。由于每个目标仅由一个回归器表示，因此可以通过检查其相应的回归器来获得有关目标的知识”

这意味着一个潜在的实现可能是对每个目标的回归步骤进行并行化。然后，您可以同时分配计算以加快速度。

据我所知，没有本地实现，但如果您查看scikit learn实现，它说“策略包括为每个目标装配一个回归器。由于每个目标仅由一个回归器表示，因此可以通过检查其相应的回归器来获得有关目标的知识”

这意味着一个潜在的实现可能是为每个目标并行化回归步骤。然后，您可以同时分配计算以加快速度。

您找到问题的解决方案了吗？您找到问题的解决方案了吗？

LabeledPoint(label: Array[Double], features: Array[Double])