Python 随机森林分层抽样
我正在建立一个随机森林分类模型,其响应变量分割为98%(假)-2%(真)。我正在使用Scikit Learn的随机森林分类器进行此操作Python 随机森林分层抽样,python,scikit-learn,classification,random-forest,Python,Scikit Learn,Classification,Random Forest,我正在建立一个随机森林分类模型,其响应变量分割为98%(假)-2%(真)。我正在使用Scikit Learn的随机森林分类器进行此操作 处理这种不平衡数据并避免过采样的最佳方法是什么?您可以使用参数class\u weight 与{class\u label:weight} 你可以给小班学生更多的权重,并通过交叉验证找到最佳权重 例如class_weight={1:10,0:1}。为标记为1的类赋予更多权重。在sklearn的随机林分类器的较新版本中,您可以简单地设置class_weight=“
处理这种不平衡数据并避免过采样的最佳方法是什么?您可以使用参数
class\u weight
与{class\u label:weight}
你可以给小班学生更多的权重,并通过交叉验证找到最佳权重
例如
class_weight={1:10,0:1}
。为标记为1的类赋予更多权重。在sklearn的随机林分类器的较新版本中,您可以简单地设置class_weight=“balanced”。我已经在这里回答了这个问题。请查收。