Machine learning 为什么是交替最小二乘法;最适用于以隐式数据为中心的系统;?

Machine learning 为什么是交替最小二乘法;最适用于以隐式数据为中心的系统;?,machine-learning,recommendation-engine,svd,Machine Learning,Recommendation Engine,Svd,为了了解Netflix大奖的解决方案,我正在阅读斯蒂芬·高尔的论文。在“学习算法”一节中指出:“ALS最好用于以隐式数据为中心的系统”,而不是用户对项目的明确反馈评分。我在论文中找不到关于这一点的进一步讨论 为什么会这样 显式数据由用户对电影的评分组成。 隐式数据考虑了用户的行为;他们看了多长时间的电影,多少次,搜索历史。。 因此,隐式数据集要大得多,可以表示所有用户,而显式数据集仅表示经常给电影评分的用户。对于显式数据,有很多缺失值,因此该模型的目标是仅基于用户的其他评分来填充所有缺失评分值的

为了了解Netflix大奖的解决方案,我正在阅读斯蒂芬·高尔的论文。在“学习算法”一节中指出:“ALS最好用于以隐式数据为中心的系统”,而不是用户对项目的明确反馈评分。我在论文中找不到关于这一点的进一步讨论


为什么会这样

显式数据由用户对电影的评分组成。 隐式数据考虑了用户的行为;他们看了多长时间的电影,多少次,搜索历史。。 因此,隐式数据集要大得多,可以表示所有用户,而显式数据集仅表示经常给电影评分的用户。对于显式数据,有很多缺失值,因此该模型的目标是仅基于用户的其他评分来填充所有缺失评分值的用户。另一方面,隐式模型基于关于用户的许多因素、关于电影的因素以及这些因素之间的关系来确定用户喜欢特定电影的可能性。ALS能够为隐式和显式数据集建立模型,但隐式数据集更好地表示用户,因此隐式模型也是

从数学上讲,显式模型可以用一个方程来创建,而隐式模型可以用一个方程组来形成模型

上面的文章提到了显式与隐式的一些区别