Matrix 推荐系统中的矩阵分解方法

Matrix 推荐系统中的矩阵分解方法,matrix,machine-learning,recommendation-engine,collaborative-filtering,Matrix,Machine Learning,Recommendation Engine,Collaborative Filtering,我读了一些关于推荐系统中矩阵分解方法的书,发现了这个非常好的教程: 一切都很好,但这一段引起了我的兴趣: 现在你可能想到了一个问题:如果我们找到两个矩阵p和Q,使得PXQ近似于R,我们对所有看不见的评级的预测不都是零吗?事实上,我们并不是真的想得到P和Q,这样我们就可以精确地复制R。相反,我们只会尽量减少观察到的用户项对的错误。换句话说,如果我们让T成为一组元组,每个元组的形式都是(u_i,d_j,r_ij),这样T包含所有观察到的用户项对以及相关的评分,那么我们只是试图最小化T中(u_i,d_

我读了一些关于推荐系统中矩阵分解方法的书,发现了这个非常好的教程:

一切都很好,但这一段引起了我的兴趣:

现在你可能想到了一个问题:如果我们找到两个矩阵pQ,使得PXQ近似于R,我们对所有看不见的评级的预测不都是零吗?事实上,我们并不是真的想得到P和Q,这样我们就可以精确地复制R。相反,我们只会尽量减少观察到的用户项对的错误。换句话说,如果我们让T成为一组元组,每个元组的形式都是(u_i,d_j,r_ij),这样T包含所有观察到的用户项对以及相关的评分,那么我们只是试图最小化T中(u_i,d_j,r_ij)的每个e_ij。(换句话说,T是我们的一组训练数据。)至于其余的未知数,一旦了解了用户、项目和功能之间的关联,我们将能够确定它们的值

我想知道是否有人能帮我解决这个问题?潜在因素是否有助于我们了解每个用户和项目的行为


感谢

潜在因素是描述用户和项目的两组值(一组用于用户,一组用于项目)。基本上,您要做的是找到项目和用户的数字表示

假设您有电影分级系统,有3个用户因素和3个电影因素(项目)。用户项可以是您对喜剧、戏剧或动作片的喜爱程度,以及电影因素喜剧、戏剧或动作片的喜爱程度。从这些属性,您可以估计其他对的收视率。此模型为您找到这些抽象因素

这意味着您只能为您有评分的项目和用户找到合理的表示方式。
因此,当你训练你的模型时,你使用已知的评分来估计这种表示。从中你可以尝试预测用户和项目的未知评分。

你的问题到底是什么?你能澄清一下吗?潜在因素如何帮助识别未知数量?我可以拿出一定数量的用户-项目配对,并将其作为一个例子测试集。我可以对其余部分进行训练。我的算法如何预测测试集中训练集中为零的值?如果我理解正确,我的预测矩阵将从训练集中生成。对于训练集中的非零值,它将具有更大的值。同一预测矩阵如何用于我的test集?试着解释一下,如果还有什么你不知道的,让我知道。谢谢@JoãoAlmeida。所以,如果我从训练集中(每行)创建一个非零值的测试集,并将所有其他值保持为零。我应该能够使用从训练集中创建的预测矩阵推荐该项目。我说的对吗?