Machine learning 协作过滤方法是否需要培训数据?

Machine learning 协作过滤方法是否需要培训数据?,machine-learning,recommendation-engine,Machine Learning,Recommendation Engine,我即将开始为视频编写一个推荐系统,主要基于协作过滤,因为视频元数据非常稀少,还有一些基于内容的过滤。但是,我不确定如何处理培训数据。在推荐系统中,特别是在协作方法中,培训数据是否很重要?如果是这样,我如何生成这种数据,或者我应该查找什么类型的数据?任何ML算法都需要数据。例如,以一种方法为例 它接收(不完整的)费率矩阵:行表示用户,列表示项目,单元格包含特定用户对特定项目的费率。然后通过分解该矩阵,您可以获得每个用户和每个项目的潜在向量表示,从而可以预测未来的费率。显然,根据该模型,用户最感兴趣

我即将开始为视频编写一个推荐系统,主要基于协作过滤,因为视频元数据非常稀少,还有一些基于内容的过滤。但是,我不确定如何处理培训数据。在推荐系统中,特别是在协作方法中,培训数据是否很重要?如果是这样,我如何生成这种数据,或者我应该查找什么类型的数据?

任何ML算法都需要数据。例如,以一种方法为例

它接收(不完整的)费率矩阵:行表示用户,列表示项目,单元格包含特定用户对特定项目的费率。然后通过分解该矩阵,您可以获得每个用户和每个项目的潜在向量表示,从而可以预测未来的费率。显然,根据该模型,用户最感兴趣的是比率最高的看不见的项目


本质上,矩阵分解学习预测已知用户和项目的新费率。

您需要数据来训练模型吗?当然除了您已经确定的其他元数据之外,您是否还需要任何用户项交互数据?我认为你无法生成你想要学习的真实数据。