xtest=和ytest=在R中的randomForest算法中做什么?

xtest=和ytest=在R中的randomForest算法中做什么?,r,random-forest,R,Random Forest,我正在拟合一个随机林,并使用以下代码将我的数据拆分为一个训练集和一个测试集: 随机森林文档中的培训: 如果给出了xtest,则测试集的预测将在树生长时“就地”完成。如果还提供了ytest,并且do.trace设置为某个正整数,则对于每个do.trace树,都会打印测试集错误。测试集的结果将在生成的randomForest对象的测试组件中返回。对于分类,投票组件(用于训练或测试集数据)包含为类接收的案例投票。如果norm.voces=TRUE,则给出分数,该分数可作为类别的预测概率 从这里可以理解

我正在拟合一个随机林,并使用以下代码将我的数据拆分为一个训练集和一个测试集:


随机森林
文档中的培训:

如果给出了
xtest
,则测试集的预测将在树生长时“就地”完成。如果还提供了
ytest
,并且
do.trace
设置为某个正整数,则对于每个
do.trace
树,都会打印测试集错误。测试集的结果将在生成的
randomForest
对象的测试组件中返回。对于分类,投票组件(用于训练或测试集数据)包含为类接收的案例投票。如果
norm.voces=TRUE
,则给出分数,该分数可作为类别的预测概率

从这里可以理解,仅将响应变量传递给
ytest
参数,不会改变
randomForest
的工作方式

如果希望
randomForest
函数“就地”进行预测,即当树木生长时,必须将不带预测变量的测试数据传递给
xtest
参数,如下所示:

bag.boston1 <- randomForest(medv~., data=Boston, subset=train, mtry=13, importance=TRUE, 
                            xtest=subset(testB, select=-medv))
在这种情况下,除了预测之外,我们还得到了一些附加值。它们分别是均方误差的
mse
和r平方的
rsq
,都是在
回归
的情况下生长的每一棵树。对于
分类
,它们是:
错误率
,即每个树的测试错误率,
混淆
混淆矩阵和
投票
给出每个输出类的投票计数(或标准化投票计数)


以上所有值都可以通过以下方式访问:
bag.boston2$test

我建议将下面的答案标记为解决方案
bag.boston1 <- randomForest(medv~., data=Boston, subset=train, mtry=13, importance=TRUE, 
                            xtest=subset(testB, select=-medv))
bag.boston2 <- randomForest(medv~., data=Boston, subset=train, mtry=13, importance=TRUE, 
                            xtest=subset(testB, select=-medv), ytest=testB$medv)