Apache spark 基于隐式反馈的推荐——Spark Mlib

Apache spark 基于隐式反馈的推荐——Spark Mlib,apache-spark,logistic-regression,apache-spark-mllib,collaborative-filtering,Apache Spark,Logistic Regression,Apache Spark Mllib,Collaborative Filtering,我从用户那里得到了关于他们与不同产品互动的隐性反馈。以下是数据集的结构:用户id、产品类别、事件日期、查看次数、购买次数 基于这些数据,我试图预测用户对某个产品类别的亲和力得分。MLIB隐式表单需要分级格式的输入数据集(用户:Int,产品:Int,分级:Double)。但是如何包括查看计数和购买计数 如果MLLIB不能使用,还有其他方法可以使用吗。我的产品类别有限(仅8个产品类别)。在这种情况下,我可以使用8个逻辑回归模型来预测亲和力吗 谢谢您所描述的内容被称为用于。这是典型结果的推广,它只有两

我从用户那里得到了关于他们与不同产品互动的隐性反馈。以下是数据集的结构:用户id、产品类别、事件日期、查看次数、购买次数

基于这些数据,我试图预测用户对某个产品类别的亲和力得分。MLIB隐式表单需要分级格式的输入数据集(用户:Int,产品:Int,分级:Double)。但是如何包括查看计数和购买计数

如果MLLIB不能使用,还有其他方法可以使用吗。我的产品类别有限(仅8个产品类别)。在这种情况下,我可以使用8个逻辑回归模型来预测亲和力吗


谢谢

您所描述的内容被称为用于。这是典型结果的推广,它只有两个结果(二进制)

看起来您试图应用的模型在本例中不起作用,正如您所指出的

查看Spark ML/MLlib文档以了解更多信息

您可以将每个输入(查看计数和购买计数)视为单独的特征(输入数据),以使用现有的已知数据(包括结果)来训练模型

当您对新数据进行评分/预测时,模型将返回每个可能结果的概率:8,在本例中。。。每种产品类别1个。然后选择概率最高的类别

以下是一些相关的Spark文档链接:

Spark的逻辑回归编程指南

当前spark.mllib逻辑回归API

新spark.ml逻辑回归API

(注意:现在只支持二元逻辑回归,但在可用时应该迁移到二元逻辑回归)


您所描述的内容被称为用于。这是典型结果的推广,它只有两个结果(二进制)

看起来您试图应用的模型在本例中不起作用,正如您所指出的

查看Spark ML/MLlib文档以了解更多信息

您可以将每个输入(查看计数和购买计数)视为单独的特征(输入数据),以使用现有的已知数据(包括结果)来训练模型

当您对新数据进行评分/预测时,模型将返回每个可能结果的概率:8,在本例中。。。每种产品类别1个。然后选择概率最高的类别

以下是一些相关的Spark文档链接:

Spark的逻辑回归编程指南

当前spark.mllib逻辑回归API

新spark.ml逻辑回归API

(注意:现在只支持二元逻辑回归,但在可用时应该迁移到二元逻辑回归)


您是在尝试预测亲和力得分还是基于亲和力进行推荐?例如,您可能有一个购买与访问的比率,保持该比率为评级(此处为亲和力评级)并执行推荐

您是在尝试预测亲和力得分还是基于亲和力继续推荐?例如,您可能有一个购买与访问的比率,将其保留为评级(此处为亲和力评级),然后执行推荐

感谢您的回复。使用单一逻辑回归模型的一个挑战是——结果不是相互排斥的。例如,将因变量定义为在未来7天内购买产品类别,并且客户将在多个类别中进行购买。在这种情况下,我可以使用什么方法。谢谢你的回复。使用单一逻辑回归模型的一个挑战是——结果不是相互排斥的。例如,将因变量定义为在未来7天内购买产品类别,并且客户将在多个类别中进行购买。在这种情况下,我可以使用什么方法。谢谢我正在尝试预测每个产品类别的亲和力得分。我现在不需要推荐。我正在尝试预测每个产品类别的亲和力得分。我现在不需要推荐。