Apache spark 基于隐式反馈的推荐——Spark Mlib_Apache Spark_Logistic Regression_Apache Spark Mllib_Collaborative Filtering

Apache spark 基于隐式反馈的推荐——Spark Mlib

apache-spark

Apache spark 基于隐式反馈的推荐——Spark Mlib,apache-spark,logistic-regression,apache-spark-mllib,collaborative-filtering,Apache Spark,Logistic Regression,Apache Spark Mllib,Collaborative Filtering,我从用户那里得到了关于他们与不同产品互动的隐性反馈。以下是数据集的结构：用户id、产品类别、事件日期、查看次数、购买次数基于这些数据，我试图预测用户对某个产品类别的亲和力得分。MLIB隐式表单需要分级格式的输入数据集（用户：Int，产品：Int，分级：Double）。但是如何包括查看计数和购买计数如果MLLIB不能使用，还有其他方法可以使用吗。我的产品类别有限（仅8个产品类别）。在这种情况下，我可以使用8个逻辑回归模型来预测亲和力吗谢谢您所描述的内容被称为用于。这是典型结果的推广，它只有两

我从用户那里得到了关于他们与不同产品互动的隐性反馈。以下是数据集的结构：用户id、产品类别、事件日期、查看次数、购买次数

基于这些数据，我试图预测用户对某个产品类别的亲和力得分。MLIB隐式表单需要分级格式的输入数据集（用户：Int，产品：Int，分级：Double）。但是如何包括查看计数和购买计数

如果MLLIB不能使用，还有其他方法可以使用吗。我的产品类别有限（仅8个产品类别）。在这种情况下，我可以使用8个逻辑回归模型来预测亲和力吗

谢谢

您所描述的内容被称为用于。这是典型结果的推广，它只有两个结果（二进制）

看起来您试图应用的模型在本例中不起作用，正如您所指出的

查看Spark ML/MLlib文档以了解更多信息

您可以将每个输入（查看计数和购买计数）视为单独的特征（输入数据），以使用现有的已知数据（包括结果）来训练模型

当您对新数据进行评分/预测时，模型将返回每个可能结果的概率：8，在本例中。。。每种产品类别1个。然后选择概率最高的类别

以下是一些相关的Spark文档链接：

Spark的逻辑回归编程指南

当前spark.mllib逻辑回归API

新spark.ml逻辑回归API

（注意：现在只支持二元逻辑回归，但在可用时应该迁移到二元逻辑回归）