Prediction 利用效用矩阵SVD训练推荐系统时,如何对测试集进行预测?
这听起来可能很愚蠢,但我没有通过效用矩阵构建推荐系统的工作流:X[I,j]=第I个用户对第j个对象的喜爱程度。关于实际问题,我参考 假设仅从训练集创建的X是一个稀疏矩阵,其条目大多未知/缺失。通过某种方法,我们设法找到U和V,使X的已知条目与UV的相应条目之间的差异最小化。现在是对测试集进行预测的时候了Prediction 利用效用矩阵SVD训练推荐系统时,如何对测试集进行预测?,prediction,svd,test-data,recommender-systems,Prediction,Svd,Test Data,Recommender Systems,这听起来可能很愚蠢,但我没有通过效用矩阵构建推荐系统的工作流:X[I,j]=第I个用户对第j个对象的喜爱程度。关于实际问题,我参考 假设仅从训练集创建的X是一个稀疏矩阵,其条目大多未知/缺失。通过某种方法,我们设法找到U和V,使X的已知条目与UV的相应条目之间的差异最小化。现在是对测试集进行预测的时候了 如果一对(用户、对象)已包含在X的未知条目中,我们是否应该信任位于UV相同位置的值?我以为这就是效用矩阵和SVD的全部要点,直到Simon写了很多关于“SVD算法倾向于把稀疏观察的电影或用户
- 如果一对(用户、对象)已包含在X的未知条目中,我们是否应该信任位于UV相同位置的值?我以为这就是效用矩阵和SVD的全部要点,直到Simon写了很多关于“SVD算法倾向于把稀疏观察的电影或用户弄得一团糟”,然后我就迷路了
- 如果用户已包含在培训集中,但对象未包含在培训集中(或相反),我们是否使用用户在培训集中给出的平均分数进行预测?或者Simon的博客中的改进者是必需的?更重要的是,我们应该使用X或UV来计算(原始或混合)平均值吗