Statistics 如果数据集中的某些实际值为0,如何计算MAPE?

Statistics 如果数据集中的某些实际值为0,如何计算MAPE?,statistics,data-science,forecasting,usage-statistics,predictive,Statistics,Data Science,Forecasting,Usage Statistics,Predictive,我是数据科学的新手,试图理解预测与实际的差异评估 假设我有实际值: 27.580 25.950 0.000 (Sum = 53.53) 我使用XGboost的预测值是: 29.9 25.4 15.0 (Sum = 70.3) 仅仅根据总和进行评估是否更好?示例添加所有实际值减去所有预测值?差异=70.3-53.53 还是基于MSE、MAE、RMSE、MAPE等预测误差技术来评估差异更好 既然我知道MAPE是最被广泛接受的,那么如何在0是分母的情况下实现它呢 是否有更

我是数据科学的新手,试图理解预测与实际的差异评估

假设我有实际值:

27.580
25.950
 0.000 (Sum = 53.53)
我使用XGboost的预测值是:

    29.9
    25.4
    15.0 (Sum = 70.3)
仅仅根据总和进行评估是否更好?示例添加所有实际值减去所有预测值?差异=70.3-53.53

还是基于MSE、MAE、RMSE、MAPE等预测误差技术来评估差异更好

既然我知道MAPE是最被广泛接受的,那么如何在0是分母的情况下实现它呢


是否有更好的方法来评估与实际值的偏差,或者这些是唯一合法的方法?我的目标是建立更多涉及不同变量的预测模型,这些变量将给出不同的预测值,然后选择与实际值偏差最小的模型。

如果要基于每个点或总和进行评估,则取决于数据和用例

例如,如果每个点代表一个时间段,并且每个时间段的准确性很重要(例如对于生产计划),那么我会说需要对每个时间段进行评估

如果你要衡量总和的准确性,那么你也可以根据总和进行预测

对于你在MAPE上的问题,你在这里提到的问题是无法回避的。您的数据必须非零,MAPE才有价值。如果您只评估一个时间序列,那么您可以使用MAE代替,这样您就不存在精度无限/未定义的问题。 但是,有很多方法可以衡量准确性,我的经验是,这在很大程度上取决于您的用例和数据集,哪一种更可取。有关精度度量的一些优点,请参见