xtest=和ytest=在R中的randomForest算法中做什么？_R_Random Forest

xtest=和ytest=在R中的randomForest算法中做什么？

xtest=和ytest=在R中的randomForest算法中做什么？,r,random-forest,R,Random Forest,我正在拟合一个随机林，并使用以下代码将我的数据拆分为一个训练集和一个测试集：随机森林文档中的培训：如果给出了xtest，则测试集的预测将在树生长时“就地”完成。如果还提供了ytest，并且do.trace设置为某个正整数，则对于每个do.trace树，都会打印测试集错误。测试集的结果将在生成的randomForest对象的测试组件中返回。对于分类，投票组件（用于训练或测试集数据）包含为类接收的案例投票。如果norm.voces=TRUE，则给出分数，该分数可作为类别的预测概率从这里可以理解

我正在拟合一个随机林，并使用以下代码将我的数据拆分为一个训练集和一个测试集：

随机森林文档中的培训：
如果给出了xtest
，则测试集的预测将在树生长时“就地”完成。如果还提供了ytest
，并且do.trace
设置为某个正整数，则对于每个do.trace
树，都会打印测试集错误。测试集的结果将在生成的randomForest
对象的测试组件中返回。对于分类，投票组件（用于训练或测试集数据）包含为类接收的案例投票。如果norm.voces=TRUE
，则给出分数，该分数可作为类别的预测概率
从这里可以理解，仅将响应变量传递给ytest
参数，不会改变randomForest
的工作方式
如果希望randomForest
函数“就地”进行预测，即当树木生长时，必须将不带预测变量的测试数据传递给xtest
参数，如下所示：
bag.boston1 <- randomForest(medv~., data=Boston, subset=train, mtry=13, importance=TRUE, 
                            xtest=subset(testB, select=-medv))

在这种情况下，除了预测之外，我们还得到了一些附加值。它们分别是均方误差的mse
和r平方的rsq
，都是在回归
的情况下生长的每一棵树。对于分类
，它们是：错误率
，即每个树的测试错误率，混淆
混淆矩阵和投票
给出每个输出类的投票计数（或标准化投票计数）
以上所有值都可以通过以下方式访问：bag.boston2$test
我建议将下面的答案标记为解决方案
bag.boston1 <- randomForest(medv~., data=Boston, subset=train, mtry=13, importance=TRUE, 
                            xtest=subset(testB, select=-medv))

bag.boston2 <- randomForest(medv~., data=Boston, subset=train, mtry=13, importance=TRUE, 
                            xtest=subset(testB, select=-medv), ytest=testB$medv)