R 随机森林中的袋外误差图

R 随机森林中的袋外误差图,r,classification,random-forest,R,Classification,Random Forest,我试图将随机森林与我的数据集相匹配,以便在对照组和阿尔茨海默病组之间进行分类。在第一次尝试中,我得到了左侧的OOB错误图,在第二次尝试中,我减少了数据集中变量的数量,我得到了右侧的OOB错误图。我的问题是比较这两个图,什么是更好的OOB图?阿尔茨海默和控制的类误差应该接近森林的OOB曲线吗?如果是,为什么?右侧的绘图具有更好的OOB错误。我假设Alzheimer和控制线也是OOB错误,但是针对特定类计算的。随机森林预测器是通过自举一部分样本来构造的,OOB误差是在算法每次迭代中未选择的样本上计算

我试图将随机森林与我的数据集相匹配,以便在对照组和阿尔茨海默病组之间进行分类。在第一次尝试中,我得到了左侧的OOB错误图,在第二次尝试中,我减少了数据集中变量的数量,我得到了右侧的OOB错误图。我的问题是比较这两个图,什么是更好的OOB图?阿尔茨海默和控制的类误差应该接近森林的OOB曲线吗?如果是,为什么?

右侧的绘图具有更好的OOB错误。我假设Alzheimer和控制线也是OOB错误,但是针对特定类计算的。随机森林预测器是通过自举一部分样本来构造的,OOB误差是在算法每次迭代中未选择的样本上计算出来的。因此,OOB错误是在您按照所述构建模型时对性能的估计,错误越小当然越好

“阿尔茨海默病和对照组的类错误是否应该更接近森林的OOB曲线?”这取决于你的模型在预测每个类方面有多好。如果两个类的分类错误相似,那么OOB错误将接近这两个类