Python 二元分类中特征的判定标准
我在h2o中使用DRF进行了二元分类。我得到了特征的重要性,然后我要求找到每个特征的标准 例如:我必须对接受和拒绝的用户进行分类,特征是年龄、工资、工作经验、居住城市(当然已经解码)。所以,我的老板想知道用户被拒绝或接受的倾向是在哪个年龄段,哪个工资范围,哪个城市有被拒绝或接受的倾向 我不会错,但我想要的输出可能如下所示:Python 二元分类中特征的判定标准,python,machine-learning,data-science,random-forest,h2o,Python,Machine Learning,Data Science,Random Forest,H2o,我在h2o中使用DRF进行了二元分类。我得到了特征的重要性,然后我要求找到每个特征的标准 例如:我必须对接受和拒绝的用户进行分类,特征是年龄、工资、工作经验、居住城市(当然已经解码)。所以,我的老板想知道用户被拒绝或接受的倾向是在哪个年龄段,哪个工资范围,哪个城市有被拒绝或接受的倾向 我不会错,但我想要的输出可能如下所示: Tendency salary for accepted user = 10k - 50k Tendency salary for accepted user = 5k -
Tendency salary for accepted user = 10k - 50k
Tendency salary for accepted user = 5k - 30k
Tendency age for accepted user = 18 - 55
Tendency age for rejected user = 31 - 35
Tendency cities for accepted user = 1, 5, 10, 23
Tendency cities for rejected user = 3, 4, 12, 36
so on..
如何实现
p、 s:我有一个已接受用户的列表。我想你需要一些类似于部分依赖关系图的东西。 以下是H2O中的一个示例:
PDP将显示目标概率如何取决于某个变量的值。这似乎很宽泛/模糊,您能更具体一点吗?看:,。是的,这就是我要找的。解释机器学习模型,谢谢!