Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/78.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R中的随机林:报告和观测误差值之间的差异_R - Fatal编程技术网

R中的随机林:报告和观测误差值之间的差异

R中的随机林:报告和观测误差值之间的差异,r,R,我尝试在数据集上拟合一个随机林。花了好几个小时,但最终还是安装好了。使用的命令是: 模型这个问题的相同答案适用于: 您可以将这些值分别解释为有重采样和无重采样的样本中的 当您适合模型时,软件包插入符号执行引导重采样,重复25次,这可以在模型输出中看到。因此,精度值基于25 x 13737个观测值。为了创建混淆矩阵,您使用最终模型(mtry=2的模型)预测训练样本的结果,训练样本的长度为13737。因此,在相应的精度上有轻微差异是正常的 在评估拟合优度时需要小心,因为您正在使用相同的数据集训练和评

我尝试在数据集上拟合一个随机林。花了好几个小时,但最终还是安装好了。使用的命令是:
模型这个问题的相同答案适用于:

您可以将这些值分别解释为有重采样和无重采样的样本中的

当您适合模型时,软件包插入符号执行引导重采样,重复25次,这可以在模型输出中看到。因此,精度值基于25 x 13737个观测值。为了创建混淆矩阵,您使用最终模型(mtry=2的模型)预测训练样本的结果,训练样本的长度为13737。因此,在相应的精度上有轻微差异是正常的

在评估拟合优度时需要小心,因为您正在使用相同的数据集训练和评估模型。毫不奇怪,你得到了一个大的准确性。使用看不见的数据集评估最终模型总是很好的,以确保其性能并检测可能的过度拟合问题

mtry   Accuracy    Kappa       Accuracy SD   Kappa SD

2    0.9888012  0.9858367  0.001844763  0.002329859
27   0.9882821  0.9851812  0.001874991  0.002365894
52   0.9820495  0.9773000  0.003680805  0.004649905
        A 3906    0    0    0    0
        B    0 2658    0    0    0
        C    0    0 2396    0    0
        D    0    0    0 2252    0
        E    0    0    0    0 2525