Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/65.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 如何使用插入符号包解释模型输出的准确性_R - Fatal编程技术网

R 如何使用插入符号包解释模型输出的准确性

R 如何使用插入符号包解释模型输出的准确性,r,R,我正在使用caret软件包训练一个模型,并希望得到模型的准确性。我听到的一种常见方法是使用confusionMatrix。然而,当我运行下面的代码时,经过训练的模型给出了一些与confusionMatrix()报告略有不同的精度值。所以我的问题是我应该使用什么样的准确度?如何解释模型在控制台中直接给出的准确性 ModelRF_ALL_b <- train(price~.,method="rf",data=datatraining_b) ModelRF_ALL_b 我还可以运行confus

我正在使用caret软件包训练一个模型,并希望得到模型的准确性。我听到的一种常见方法是使用confusionMatrix。然而,当我运行下面的代码时,经过训练的模型给出了一些与confusionMatrix()报告略有不同的精度值。所以我的问题是我应该使用什么样的准确度?如何解释模型在控制台中直接给出的准确性

ModelRF_ALL_b <- train(price~.,method="rf",data=datatraining_b)
ModelRF_ALL_b
我还可以运行confusionMatrix()

它的精度为1

Confusion Matrix and Statistics

      Reference
Prediction    0    1
     0 6414    0
     1    0 1729

           Accuracy : 1          
             95% CI : (0.9995, 1)
No Information Rate : 0.7877     
P-Value [Acc > NIR] : < 2.2e-16  

              Kappa : 1          
 Mcnemar's Test P-Value : NA         

        Sensitivity : 1.0000     
        Specificity : 1.0000     
     Pos Pred Value : 1.0000     
     Neg Pred Value : 1.0000     
         Prevalence : 0.7877     
     Detection Rate : 0.7877     
   Detection Prevalence : 0.7877     
  Balanced Accuracy : 1.0000     

   'Positive' Class : 0     
混淆矩阵与统计
参考文献
预测0 1
0 6414    0
1    0 1729
准确度:1
95%可信区间:(0.9995,1)
无信息率:0.7877
P值[Acc>NIR]:<2.2e-16
卡帕:1
麦克内马尔试验P值:NA
灵敏度:1.0000
特异性:1.0000
Pos Pred值:1.0000
负预测值:1.0000
患病率:0.7877
破案率:0.7877
检出率:0.7877
平衡精度:1.0000
“正”类:0

您可以将这些值解释为样本中的精度,分别使用和不使用重采样

当您适合模型时,软件包
caret
执行引导重采样,重复25次,这可以在模型输出中看到。因此,精度值基于25 x 8143个观测值。为了创建混淆矩阵,您使用最终模型(mtry=2的模型)预测训练样本的结果,该样本的长度为8143。因此,在相应的精度上有轻微差异是正常的

在评估拟合优度时需要小心,因为您正在使用相同的数据集训练和评估模型。毫不奇怪,你得到了一个大的准确性。使用看不见的数据集评估最终模型总是很好的,以确保其性能并检测可能的过度拟合问题

confusionMatrix(datatraining_b$price,
predict(ModelRF_ALL_b,datatraining_b))
Confusion Matrix and Statistics

      Reference
Prediction    0    1
     0 6414    0
     1    0 1729

           Accuracy : 1          
             95% CI : (0.9995, 1)
No Information Rate : 0.7877     
P-Value [Acc > NIR] : < 2.2e-16  

              Kappa : 1          
 Mcnemar's Test P-Value : NA         

        Sensitivity : 1.0000     
        Specificity : 1.0000     
     Pos Pred Value : 1.0000     
     Neg Pred Value : 1.0000     
         Prevalence : 0.7877     
     Detection Rate : 0.7877     
   Detection Prevalence : 0.7877     
  Balanced Accuracy : 1.0000     

   'Positive' Class : 0