Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/jquery-ui/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 在基于内容的推荐系统中,如何判断每个用户而不是每个评级? 我正在从Coursera的Andrew Ng课程中学习推荐系统,这个问题突然浮现在我的脑海中。_Machine Learning_Mathematical Optimization_Recommendation Engine - Fatal编程技术网

Machine learning 在基于内容的推荐系统中,如何判断每个用户而不是每个评级? 我正在从Coursera的Andrew Ng课程中学习推荐系统,这个问题突然浮现在我的脑海中。

Machine learning 在基于内容的推荐系统中,如何判断每个用户而不是每个评级? 我正在从Coursera的Andrew Ng课程中学习推荐系统,这个问题突然浮现在我的脑海中。,machine-learning,mathematical-optimization,recommendation-engine,Machine Learning,Mathematical Optimization,Recommendation Engine,在这门课程中,安德鲁为电影做推荐,就像Netflix一样。 我们有一个各种电影评级的输出矩阵Y,其中每个单元格Y(i,j)是用户j给电影i的评级。如果用户未对其进行评级,Y(i,j)=? 假设我们正在进行线性回归,我们有以下最小化目标: 我的问题是,这不是按评级计算的吗?与中一样,所有评级都是相等的。因此,如果有人给100部电影打分,他对算法的影响比只给10部电影打分的人更大 我想知道是否有可能根据每个用户进行判断,即所有用户都是平等的 对于用户[u]weight=1/ratings\u或者w

在这门课程中,安德鲁为电影做推荐,就像Netflix一样。 我们有一个各种电影评级的输出矩阵
Y
,其中每个单元格
Y(i,j)
是用户
j
给电影
i
的评级。如果用户未对其进行评级,
Y(i,j)=?

假设我们正在进行线性回归,我们有以下最小化目标:

我的问题是,这不是按评级计算的吗?与中一样,所有评级都是相等的。因此,如果有人给100部电影打分,他对算法的影响比只给10部电影打分的人更大


我想知道是否有可能根据每个用户进行判断,即所有用户都是平等的

对于用户[u]
weight=1/ratings\u或者
weight=1/sqrt(ratings\u for用户[u])
对损耗函数应用权重是绝对可能的。其中,
ratings\u per\u user[u]
是在您的特定示例中给予评分的用户的评分数。这是不是一个好主意是另一个问题


为了回答这个问题,我首先要问一个问题:这对你真正想解决的问题更有意义吗?如果是的话,第二个问题是:您构建的模型是否运行良好?它的交叉验证分数好吗?

我就知道!我确实猜到了这个答案,尽管我承认我是从图片中的幻灯片之前的幻灯片中得到这个想法的:)我实际上在一段时间内一直在争论按用户付费是否是个好主意。我猜“评级权重相等”比“用户权重相等”要好,因为在后一种情况下,恶意用户可以创建大量帐户,并对特定产品进行糟糕的评级。在前一种情况下,给更多电影评分的用户可能会更擅长(比如电影或时尚评论家等)。这取决于你的应用程序。对于机器学习中的许多事情,没有一个答案。您需要决定哪些指标对您的应用程序很重要,然后回答以下问题:您能否构建一个能够很好地预测这些指标的模型。我会记住:)。我之前的评论和随后的推理是针对亚马逊和Netflix这样的大型网站的,恶意用户是他们的问题。是的。Netflix为改进的推荐引擎提供了100万美元的奖金,这是有原因的。有很多方法可以改进模型。我建议的加权策略类似于其他上下文中的L1和L2特征规范化。