Machine learning 将因变量的预测值分解为截距（基线），并将剩余的归因于自变量。MLI方法_Machine Learning_Data Science_Svm_Shap_Lime

Machine learning 将因变量的预测值分解为截距（基线），并将剩余的归因于自变量。MLI方法

machine-learning

Machine learning 将因变量的预测值分解为截距（基线），并将剩余的归因于自变量。MLI方法,machine-learning,data-science,svm,shap,lime,Machine Learning,Data Science,Svm,Shap,Lime,我正在研究一个预测销售量的问题。这是一个非时间序列问题。我使用了随机林和XGBoost方法。对于本地和全局的解释，我使用SHAP。我能够在全局范围内计算出最重要的变量，并获得局部形状值估计。但这些特征的局部形状值的问题在于：它违反了一些最基本的已知假设。例如，可变折扣的贡献应为正值，因为折扣值越高，销售额越高。因此，SHAP对于该特性在本地的任何地方都应该是积极的。但对许多地方而言，这是消极的。形状值将所有局部形状值计算的基线作为预测值的平均值。但我希望基线是一个预测值，当所有特性为零时，或

我正在研究一个预测销售量的问题。这是一个非时间序列问题。我使用了随机林和XGBoost方法。对于本地和全局的解释，我使用SHAP。我能够在全局范围内计算出最重要的变量，并获得局部形状值估计。但这些特征的局部形状值的问题在于：

它违反了一些最基本的已知假设。例如，可变折扣的贡献应为正值，因为折扣值越高，销售额越高。因此，SHAP对于该特性在本地的任何地方都应该是积极的。但对许多地方而言，这是消极的。形状值将所有局部形状值计算的基线作为预测值的平均值。但我希望基线是一个预测值，当所有特性为零时，或者至少当某些特性（如折扣）为零时。这向我暗示了线性回归的截距项。一个明显的解决方案是简单地使用线性回归方法。但与XGBoost/RandomForest相比，它给出的预测/拟合非常差

我正在考虑试用石灰，但我不太确定它是否能让我分解销售预测值，并将其归因于不同的自变量

有什么方法可以让我进行体积分解吗？

欢迎使用SO！关于ML的概念性问题更适合于。同时，您可能希望检查并