Python 随机森林分层抽样

Python 随机森林分层抽样,python,scikit-learn,classification,random-forest,Python,Scikit Learn,Classification,Random Forest,我正在建立一个随机森林分类模型,其响应变量分割为98%(假)-2%(真)。我正在使用Scikit Learn的随机森林分类器进行此操作 处理这种不平衡数据并避免过采样的最佳方法是什么?您可以使用参数class\u weight 与{class\u label:weight} 你可以给小班学生更多的权重,并通过交叉验证找到最佳权重 例如class_weight={1:10,0:1}。为标记为1的类赋予更多权重。在sklearn的随机林分类器的较新版本中,您可以简单地设置class_weight=“

我正在建立一个随机森林分类模型,其响应变量分割为98%(假)-2%(真)。我正在使用Scikit Learn的随机森林分类器进行此操作


处理这种不平衡数据并避免过采样的最佳方法是什么?

您可以使用参数
class\u weight

{class\u label:weight}

你可以给小班学生更多的权重,并通过交叉验证找到最佳权重


例如
class_weight={1:10,0:1}
。为标记为1的类赋予更多权重。

在sklearn的随机林分类器的较新版本中,您可以简单地设置class_weight=“balanced”。

我已经在这里回答了这个问题。请查收。