Python分类器-如何提高召回率?
我有一个不平衡的数据集,我已经在使用SMOTE对其进行过度采样。我得到了一个1的低召回值,我正在尝试一种增加它并传播错误的方法。我很好,整体准确度降低。 下面由airbnb编写的代码就做到了这一点,而且该库似乎不是开源的Python分类器-如何提高召回率?,python,random-forest,precision-recall,Python,Random Forest,Precision Recall,我有一个不平衡的数据集,我已经在使用SMOTE对其进行过度采样。我得到了一个1的低召回值,我正在尝试一种增加它并传播错误的方法。我很好,整体准确度降低。 下面由airbnb编写的代码就做到了这一点,而且该库似乎不是开源的 我们是否可以控制拟合以提高召回值。尝试修改RF的阈值,看看这会如何影响您的精确召回curve@Valilutzik,您建议在拟合randomforest之前拟合SelectFromModel并给出阈值?明白了。min_杂质_split这是我一直在寻找的,RF的默认阈值是0.5,
我们是否可以控制拟合以提高召回值。尝试修改RF的阈值,看看这会如何影响您的精确召回curve@Valilutzik,您建议在拟合randomforest之前拟合SelectFromModel并给出阈值?明白了。min_杂质_split这是我一直在寻找的,RF的默认阈值是0.5,因此您可以使用
predict_proba
来实现这一点。除此之外,您还可以使用param:class_weight=“balanced”
实例化RF,而不是使用SMOTE,并将RF拟合到不平衡的数据上,然后查看结果