R-随机森林中的上采样

R-随机森林中的上采样,r,machine-learning,random-forest,R,Machine Learning,Random Forest,我有一个高度不平衡的数据,并希望向上采样少数类以提高准确性(少数类是感兴趣的对象) 我尝试在“randomForest”函数中使用“sampsize”选项,但它只允许向下采样。我在某个地方读过,可以使用“classwt”选项,但我不知道如何使用它 任何人都可以通过向上采样少数类(使用“randomForest”库或其他类似库)来建议在R中运行randomForest的方法吗 谢谢。最简单的方法就是充分复制少数类的数据,但这样会丢失OOB估计值 你想直接做的事情似乎没有实现,另请参见。会让你更进一

我有一个高度不平衡的数据,并希望向上采样少数类以提高准确性(少数类是感兴趣的对象)

我尝试在“randomForest”函数中使用“sampsize”选项,但它只允许向下采样。我在某个地方读过,可以使用“classwt”选项,但我不知道如何使用它

任何人都可以通过向上采样少数类(使用“randomForest”库或其他类似库)来建议在R中运行randomForest的方法吗


谢谢。

最简单的方法就是充分复制少数类的数据,但这样会丢失OOB估计值


你想直接做的事情似乎没有实现,另请参见。

会让你更进一步吗?@xhudik:在发布之前,我已经浏览了这个链接。大多数建议都是对大多数类进行抽样,并使用较小的数据大小。我想保持数据集的大小不变,但要有一个平衡的因子配置(appx.50:50)嗯,所以不幸的是,我这边没有任何建议。。。