R中的随机林:报告和观测误差值之间的差异
我尝试在数据集上拟合一个随机林。花了好几个小时,但最终还是安装好了。使用的命令是:R中的随机林:报告和观测误差值之间的差异,r,R,我尝试在数据集上拟合一个随机林。花了好几个小时,但最终还是安装好了。使用的命令是: 模型这个问题的相同答案适用于: 您可以将这些值分别解释为有重采样和无重采样的样本中的 当您适合模型时,软件包插入符号执行引导重采样,重复25次,这可以在模型输出中看到。因此,精度值基于25 x 13737个观测值。为了创建混淆矩阵,您使用最终模型(mtry=2的模型)预测训练样本的结果,训练样本的长度为13737。因此,在相应的精度上有轻微差异是正常的 在评估拟合优度时需要小心,因为您正在使用相同的数据集训练和评
模型这个问题的相同答案适用于: 您可以将这些值分别解释为有重采样和无重采样的样本中的 当您适合模型时,软件包插入符号执行引导重采样,重复25次,这可以在模型输出中看到。因此,精度值基于25 x 13737个观测值。为了创建混淆矩阵,您使用最终模型(mtry=2的模型)预测训练样本的结果,训练样本的长度为13737。因此,在相应的精度上有轻微差异是正常的 在评估拟合优度时需要小心,因为您正在使用相同的数据集训练和评估模型。毫不奇怪,你得到了一个大的准确性。使用看不见的数据集评估最终模型总是很好的,以确保其性能并检测可能的过度拟合问题
mtry Accuracy Kappa Accuracy SD Kappa SD
2 0.9888012 0.9858367 0.001844763 0.002329859
27 0.9882821 0.9851812 0.001874991 0.002365894
52 0.9820495 0.9773000 0.003680805 0.004649905
A 3906 0 0 0 0
B 0 2658 0 0 0
C 0 0 2396 0 0
D 0 0 0 2252 0
E 0 0 0 0 2525