R 随机林类中的误差

R 随机林类中的误差,r,random-forest,R,Random Forest,我正在向随机森林预测模型输入一组新数据,遇到以下错误: checkDataoldData中出错,RET: 新数据的类别与原始数据不匹配 代码如下: fit1 <- cforest((b == 'three')~ affect+ certain+ negemo+ future+swear+sad +negate+ppron+sexual+death + filler+leisure + conj+ funct + i +future + p

我正在向随机森林预测模型输入一组新数据,遇到以下错误:

checkDataoldData中出错,RET: 新数据的类别与原始数据不匹配

代码如下:

fit1 <- cforest((b == 'three')~   affect+ certain+ negemo+ future+swear+sad
            +negate+ppron+sexual+death + filler+leisure + conj+ funct + i
            +future + past + bio + body+cause + cogmech + death +
                    discrep + future +incl + motion + quant + sad + tentat + excl+insight +percept +posemo
            +ppron +quant + relativ + space + article + age + s_all + s_sad + gender 
            , data = trainset1, 
            controls=cforest_unbiased(ntree=500, mtry= 1))

testset2$pre_swl<-predict(fit1, newdata=testset2 , type='response')

训练集和测试集都是data.frame

可能当您在训练集/测试集中拆分数据时,一些变量是因子,它们的一些类/级别属于测试集,但不属于训练集。您确实意识到您没有提供任何数据??testset2是否在trainset1中有所有列?他们属于同一类:sapplytrainset1.class;sapplytestset2,class.测试集的变量比火车集多,我以前做过,但R没有抱怨,不知道为什么这次不起作用。你是使用相同类型的模型还是不同类型的模型?变量是作为因素还是作为特征?我使用相同的模型,但有一组单独的数据,我在列车集中有作为特征的变量,但这是预测变量b,而测试集没有预测变量b,但这不应该影响模型,因为我没有将测试集的结果与列车集进行比较。