Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/ssis/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Machine learning 将因变量的预测值分解为截距(基线),并将剩余的归因于自变量。MLI方法_Machine Learning_Data Science_Svm_Shap_Lime - Fatal编程技术网

Machine learning 将因变量的预测值分解为截距(基线),并将剩余的归因于自变量。MLI方法

Machine learning 将因变量的预测值分解为截距(基线),并将剩余的归因于自变量。MLI方法,machine-learning,data-science,svm,shap,lime,Machine Learning,Data Science,Svm,Shap,Lime,我正在研究一个预测销售量的问题。这是一个非时间序列问题。我使用了随机林和XGBoost方法。对于本地和全局的解释,我使用SHAP。我能够在全局范围内计算出最重要的变量,并获得局部形状值估计。但这些特征的局部形状值的问题在于: 它违反了一些最基本的已知假设。例如,可变折扣的贡献应为正值,因为折扣值越高,销售额越高。因此,SHAP对于该特性在本地的任何地方都应该是积极的。但对许多地方而言,这是消极的。 形状值将所有局部形状值计算的基线作为预测值的平均值。但我希望基线是一个预测值,当所有特性为零时,或

我正在研究一个预测销售量的问题。这是一个非时间序列问题。我使用了随机林和XGBoost方法。对于本地和全局的解释,我使用SHAP。我能够在全局范围内计算出最重要的变量,并获得局部形状值估计。但这些特征的局部形状值的问题在于:

它违反了一些最基本的已知假设。例如,可变折扣的贡献应为正值,因为折扣值越高,销售额越高。因此,SHAP对于该特性在本地的任何地方都应该是积极的。但对许多地方而言,这是消极的。 形状值将所有局部形状值计算的基线作为预测值的平均值。但我希望基线是一个预测值,当所有特性为零时,或者至少当某些特性(如折扣)为零时。这向我暗示了线性回归的截距项。 一个明显的解决方案是简单地使用线性回归方法。但与XGBoost/RandomForest相比,它给出的预测/拟合非常差

我正在考虑试用石灰,但我不太确定它是否能让我分解销售预测值,并将其归因于不同的自变量


有什么方法可以让我进行体积分解吗?

欢迎使用SO!关于ML的概念性问题更适合于。同时,您可能希望检查并