Machine learning 在基于内容的推荐系统中，如何判断每个用户而不是每个评级？我正在从Coursera的Andrew Ng课程中学习推荐系统，这个问题突然浮现在我的脑海中。_Machine Learning_Mathematical Optimization_Recommendation Engine

Machine learning 在基于内容的推荐系统中，如何判断每个用户而不是每个评级？我正在从Coursera的Andrew Ng课程中学习推荐系统，这个问题突然浮现在我的脑海中。

machine-learning

Machine learning 在基于内容的推荐系统中，如何判断每个用户而不是每个评级？我正在从Coursera的Andrew Ng课程中学习推荐系统，这个问题突然浮现在我的脑海中。,machine-learning,mathematical-optimization,recommendation-engine,Machine Learning,Mathematical Optimization,Recommendation Engine,在这门课程中，安德鲁为电影做推荐，就像Netflix一样。我们有一个各种电影评级的输出矩阵Y，其中每个单元格Y（i，j）是用户j给电影i的评级。如果用户未对其进行评级，Y（i，j）=？假设我们正在进行线性回归，我们有以下最小化目标：我的问题是，这不是按评级计算的吗？与中一样，所有评级都是相等的。因此，如果有人给100部电影打分，他对算法的影响比只给10部电影打分的人更大我想知道是否有可能根据每个用户进行判断，即所有用户都是平等的对于用户[u]weight=1/ratings\u或者w

在这门课程中，安德鲁为电影做推荐，就像Netflix一样。我们有一个各种电影评级的输出矩阵

，其中每个单元格

Y（i，j）

是用户

给电影

的评级。如果用户未对其进行评级，

Y（i，j）=？

假设我们正在进行线性回归，我们有以下最小化目标：

我的问题是，这不是按评级计算的吗？与中一样，所有评级都是相等的。因此，如果有人给100部电影打分，他对算法的影响比只给10部电影打分的人更大

我想知道是否有可能根据每个用户进行判断，即所有用户都是平等的

对于用户[u]

weight=1/ratings\u或者weight=1/sqrt（ratings\u for用户[u]）
对损耗函数应用权重是绝对可能的。其中，ratings\u per\u user[u]
是在您的特定示例中给予评分的用户的评分数。这是不是一个好主意是另一个问题
为了回答这个问题，我首先要问一个问题：这对你真正想解决的问题更有意义吗？如果是的话，第二个问题是：您构建的模型是否运行良好？它的交叉验证分数好吗？
我就知道！我确实猜到了这个答案，尽管我承认我是从图片中的幻灯片之前的幻灯片中得到这个想法的：）我实际上在一段时间内一直在争论按用户付费是否是个好主意。我猜“评级权重相等”比“用户权重相等”要好，因为在后一种情况下，恶意用户可以创建大量帐户，并对特定产品进行糟糕的评级。在前一种情况下，给更多电影评分的用户可能会更擅长（比如电影或时尚评论家等）。这取决于你的应用程序。对于机器学习中的许多事情，没有一个答案。您需要决定哪些指标对您的应用程序很重要，然后回答以下问题：您能否构建一个能够很好地预测这些指标的模型。我会记住：）。我之前的评论和随后的推理是针对亚马逊和Netflix这样的大型网站的，恶意用户是他们的问题。是的。Netflix为改进的推荐引擎提供了100万美元的奖金，这是有原因的。有很多方法可以改进模型。我建议的加权策略类似于其他上下文中的L1和L2特征规范化。