Scikit learn scikit学习中的平衡随机林（python）_Scikit Learn_Classification_Random Forest

Scikit learn scikit学习中的平衡随机林（python）

scikit-learn

Scikit learn scikit学习中的平衡随机林（python）,scikit-learn,classification,random-forest,Scikit Learn,Classification,Random Forest,我想知道在最新版本的scikit学习包中是否有平衡随机林（BRF）的实现。BRF用于数据不平衡的情况。它与普通RF一样工作，但对于每个自举迭代，它通过欠采样来平衡患病率等级。例如，给定两个类N0=100，N1=30个实例，在每次随机抽样时，它从第一个类中抽取（替换）30个实例，从第二个类中抽取相同数量的实例，即在平衡数据集上训练一棵树。了解更多信息 RandomForestClassifier（）确实有“class_weight=”参数，该参数可能被设置为“balanced”，但我不确定它是否与

我想知道在最新版本的scikit学习包中是否有平衡随机林（BRF）的实现。BRF用于数据不平衡的情况。它与普通RF一样工作，但对于每个自举迭代，它通过欠采样来平衡患病率等级。例如，给定两个类N0=100，N1=30个实例，在每次随机抽样时，它从第一个类中抽取（替换）30个实例，从第二个类中抽取相同数量的实例，即在平衡数据集上训练一棵树。了解更多信息

RandomForestClassifier（）确实有“class_weight=”参数，该参数可能被设置为“balanced”，但我不确定它是否与bootsrapped训练样本的下采样有关。

您要查找的是from

有效地，它允许你做的是，在顶部拟合估计器的同时，连续地对你的大多数类进行抽样不足。您可以使用随机林或scikit学习中的任何基估计量。这是一个。

现在IMBRearn中有一个名为的类。它的工作原理类似于前面提到的BalancedBaggingClassifier，但专门用于随机林

from imblearn.ensemble import BalancedRandomForestClassifier
brf = BalancedRandomForestClassifier(n_estimators=100, random_state=0)
brf.fit(X_train, y_train)
y_pred = brf.predict(X_test)

我们正在努力。IMBRearn目前是一个很好的解决方案。

from imblearn.ensemble import BalancedRandomForestClassifier
brf = BalancedRandomForestClassifier(n_estimators=100, random_state=0)
brf.fit(X_train, y_train)
y_pred = brf.predict(X_test)