R 随机林类中的误差_R_Random Forest

R 随机林类中的误差

R 随机林类中的误差,r,random-forest,R,Random Forest,我正在向随机森林预测模型输入一组新数据，遇到以下错误： checkDataoldData中出错，RET: 新数据的类别与原始数据不匹配代码如下： fit1 <- cforest((b == 'three')~ affect+ certain+ negemo+ future+swear+sad +negate+ppron+sexual+death + filler+leisure + conj+ funct + i +future + p

我正在向随机森林预测模型输入一组新数据，遇到以下错误：

checkDataoldData中出错，RET: 新数据的类别与原始数据不匹配

代码如下：

fit1 <- cforest((b == 'three')~   affect+ certain+ negemo+ future+swear+sad
            +negate+ppron+sexual+death + filler+leisure + conj+ funct + i
            +future + past + bio + body+cause + cogmech + death +
                    discrep + future +incl + motion + quant + sad + tentat + excl+insight +percept +posemo
            +ppron +quant + relativ + space + article + age + s_all + s_sad + gender 
            , data = trainset1, 
            controls=cforest_unbiased(ntree=500, mtry= 1))

testset2$pre_swl<-predict(fit1, newdata=testset2 , type='response')

训练集和测试集都是data.frame

可能当您在训练集/测试集中拆分数据时，一些变量是因子，它们的一些类/级别属于测试集，但不属于训练集。您确实意识到您没有提供任何数据？？testset2是否在trainset1中有所有列？他们属于同一类：sapplytrainset1.class；sapplytestset2，class.测试集的变量比火车集多，我以前做过，但R没有抱怨，不知道为什么这次不起作用。你是使用相同类型的模型还是不同类型的模型？变量是作为因素还是作为特征？我使用相同的模型，但有一组单独的数据，我在列车集中有作为特征的变量，但这是预测变量b，而测试集没有预测变量b，但这不应该影响模型，因为我没有将测试集的结果与列车集进行比较。