R 随机森林中的袋外误差图_R_Classification_Random Forest

R 随机森林中的袋外误差图

R 随机森林中的袋外误差图,r,classification,random-forest,R,Classification,Random Forest,我试图将随机森林与我的数据集相匹配，以便在对照组和阿尔茨海默病组之间进行分类。在第一次尝试中，我得到了左侧的OOB错误图，在第二次尝试中，我减少了数据集中变量的数量，我得到了右侧的OOB错误图。我的问题是比较这两个图，什么是更好的OOB图？阿尔茨海默和控制的类误差应该接近森林的OOB曲线吗？如果是，为什么？右侧的绘图具有更好的OOB错误。我假设Alzheimer和控制线也是OOB错误，但是针对特定类计算的。随机森林预测器是通过自举一部分样本来构造的，OOB误差是在算法每次迭代中未选择的样本上计算

我试图将随机森林与我的数据集相匹配，以便在对照组和阿尔茨海默病组之间进行分类。在第一次尝试中，我得到了左侧的OOB错误图，在第二次尝试中，我减少了数据集中变量的数量，我得到了右侧的OOB错误图。我的问题是比较这两个图，什么是更好的OOB图？阿尔茨海默和控制的类误差应该接近森林的OOB曲线吗？如果是，为什么？

右侧的绘图具有更好的OOB错误。我假设Alzheimer和控制线也是OOB错误，但是针对特定类计算的。随机森林预测器是通过自举一部分样本来构造的，OOB误差是在算法每次迭代中未选择的样本上计算出来的。因此，OOB错误是在您按照所述构建模型时对性能的估计，错误越小当然越好

“阿尔茨海默病和对照组的类错误是否应该更接近森林的OOB曲线？”这取决于你的模型在预测每个类方面有多好。如果两个类的分类错误相似，那么OOB错误将接近这两个类