Scikit learn scikit学习中的平衡随机林(python)

Scikit learn scikit学习中的平衡随机林(python),scikit-learn,classification,random-forest,Scikit Learn,Classification,Random Forest,我想知道在最新版本的scikit学习包中是否有平衡随机林(BRF)的实现。BRF用于数据不平衡的情况。它与普通RF一样工作,但对于每个自举迭代,它通过欠采样来平衡患病率等级。例如,给定两个类N0=100,N1=30个实例,在每次随机抽样时,它从第一个类中抽取(替换)30个实例,从第二个类中抽取相同数量的实例,即在平衡数据集上训练一棵树。了解更多信息 RandomForestClassifier()确实有“class_weight=”参数,该参数可能被设置为“balanced”,但我不确定它是否与

我想知道在最新版本的scikit学习包中是否有平衡随机林(BRF)的实现。BRF用于数据不平衡的情况。它与普通RF一样工作,但对于每个自举迭代,它通过欠采样来平衡患病率等级。例如,给定两个类N0=100,N1=30个实例,在每次随机抽样时,它从第一个类中抽取(替换)30个实例,从第二个类中抽取相同数量的实例,即在平衡数据集上训练一棵树。了解更多信息


RandomForestClassifier()确实有“class_weight=”参数,该参数可能被设置为“balanced”,但我不确定它是否与bootsrapped训练样本的下采样有关。

您要查找的是from


有效地,它允许你做的是,在顶部拟合估计器的同时,连续地对你的大多数类进行抽样不足。您可以使用随机林或scikit学习中的任何基估计量。这是一个。

现在IMBRearn中有一个名为的类。它的工作原理类似于前面提到的BalancedBaggingClassifier,但专门用于随机林

from imblearn.ensemble import BalancedRandomForestClassifier
brf = BalancedRandomForestClassifier(n_estimators=100, random_state=0)
brf.fit(X_train, y_train)
y_pred = brf.predict(X_test)

我们正在努力。IMBRearn目前是一个很好的解决方案。
from imblearn.ensemble import BalancedRandomForestClassifier
brf = BalancedRandomForestClassifier(n_estimators=100, random_state=0)
brf.fit(X_train, y_train)
y_pred = brf.predict(X_test)