Normalization 消除用户评级中的偏见
我有一个数据集,上面有用户对图像的评分。我使用均值-标准差标准化对评分进行标准化,以消除数据集中由于用户特定偏好而产生的偏差。这是处理偏见的正确方法,还是有其他方法可以消除用户评分中的偏见。这在以下几点上肯定是错误的:Normalization 消除用户评级中的偏见,normalization,mean,standard-deviation,rating-system,Normalization,Mean,Standard Deviation,Rating System,我有一个数据集,上面有用户对图像的评分。我使用均值-标准差标准化对评分进行标准化,以消除数据集中由于用户特定偏好而产生的偏差。这是处理偏见的正确方法,还是有其他方法可以消除用户评分中的偏见。这在以下几点上肯定是错误的: 如果你以这种方式通过标准偏差“标准化”输入,你所说的是“低可变性并不重要,只有离群值才有意义”——因为离群值本身的偏差会大于标准值 您处理的是用户满意度的“投票”,而不是“测量”。偏见,顾名思义就是关于满足感的信息——你把它扔掉了。也就是说,150年前,人们习惯于认为“没有狗,
- 如果你以这种方式通过标准偏差“标准化”输入,你所说的是“低可变性并不重要,只有离群值才有意义”——因为离群值本身的偏差会大于标准值
- 您处理的是用户满意度的“投票”,而不是“测量”。偏见,顾名思义就是关于满足感的信息——你把它扔掉了。也就是说,150年前,人们习惯于认为“没有狗,就没有爱尔兰人”这句话是可以接受的,但现在已经不那么多了。如果你想预测一家餐馆在参观后会受到多大的评价,你不能仅仅因为人们反对这个标志就打折0星级的票数李>