Python 在机器学习模型中，有没有一种方法可以给出每个预测的原因_Python_Machine Learning_Logistic Regression_Shap

Python 在机器学习模型中，有没有一种方法可以给出每个预测的原因

python machine-learning

Python 在机器学习模型中，有没有一种方法可以给出每个预测的原因,python,machine-learning,logistic-regression,shap,Python,Machine Learning,Logistic Regression,Shap,我正在做一个项目，我需要为从我的机器学习模型中得到预测的每个数据行提供一个原因。我使用逻辑回归模型（二元分类）得到我的预测，截止阈值为0.6。我曾尝试使用SHAP和ELI5来识别最重要的特性，但这对所有数据点都是全局性的。我想给每个数据点一个为什么被归类为1的原因。我真的不知道如何使它在当地为人类解释，以理解预测。我认为可以通过一些假设： 1. we use LR instead of NN 2. each variable "X" treated as binary variable 对于L

我正在做一个项目，我需要为从我的机器学习模型中得到预测的每个数据行提供一个原因。我使用逻辑回归模型（二元分类）得到我的预测，截止阈值为0.6。我曾尝试使用SHAP和ELI5来识别最重要的特性，但这对所有数据点都是全局性的。我想给每个数据点一个为什么被归类为1的原因。我真的不知道如何使它在当地为人类解释，以理解预测。

我认为可以通过一些假设：

1. we use LR instead of NN
2. each variable "X" treated as binary variable

对于LR方程：

y = 1/1+exp(-wi*xi)

席西属于{0, 1 }，可以认为Wayi是特征重要度。

对于您提到的每个实例，我们可以按w_i对x_i进行排序，并确定该实例中的x_i是0还是1。然后应该使用前10个（可能是50个）x_i进行解释。

我想让它更人性化，比如在全局数据集上进行预测时，SHAP如何告诉您哪些特征更重要。我希望每个局部点都有相似之处。@ajeevanshgautam如果您希望与其他点有相似之处，请进行研究（中的第一个命令），并通过提供一个具体的示例在此处进行分享；无论如何，你的问题就是一个很好的例子，说明了为什么这样模糊、笼统、没有充分说明的问题不适合这样做。