R 试图建立一个基于分类的预测模型,以决定哪些客户将违约
windows 10 rstudio 1.01.136 我一直在尝试建立一个模型,对将要违约或不违约的客户进行分类R 试图建立一个基于分类的预测模型,以决定哪些客户将违约,r,model,R,Model,windows 10 rstudio 1.01.136 我一直在尝试建立一个模型,对将要违约或不违约的客户进行分类 prediction_test <- predict(train.tree,newdata = test ,type = "class") 那么,有谁能告诉我如何删除这个错误吗 变量workclass只有5个值,即 as.matrix(prop.table(table(train$Workclass))) [,1] Federal
prediction_test <- predict(train.tree,newdata = test ,type = "class")
那么,有谁能告诉我如何删除这个错误吗
变量workclass只有5个值,即
as.matrix(prop.table(table(train$Workclass)))
[,1]
Federal-gov 0.02948
Never-worked 0.00021
others 0.13885
Private 0.75342
Self-emp-not-inc 0.07804
当我把其他人和其他人结合起来时,他们的比例就更小了
为了更清楚,我使用了决策树
library(rpart)
set.seed(333)
train.tree <- rpart(Income.Group~.,data = train,method = "class",
control= rpart.control(minsplit = 20,minbucket = 100,maxdepth = 10),
xval = 5)
我通过从测试数据中删除变量ID来纠正它什么类型的对象是
train.tree
?type=“workclass”
参数似乎不正确。这里不使用列名。那么您想要type=“response”
?如果你能提供一个合适的答案,你会更容易得到帮助。我已经纠正了它。它实际上是一个类,我正试图用predict来预测function@MrFlick我已经纠正了它。它的类实际上是,我正在尝试使用预测函数进行预测。请看一看。对于错误,很抱歉,所以您仍然得到关于“Workclass.dummy”的错误?我不确定代码是否更清楚,因为在样本中,您预测的是“收入群体”,而我预期的是“工人阶级”。一个完全可复制的示例,带有样本输入数据,可以澄清问题。是的,我仍然得到错误。收入。组是依赖变量,我已经转换了工人阶级,因为一些值的比例小于5%。数据集非常大,我如何在这里共享32561 OB
library(rpart)
set.seed(333)
train.tree <- rpart(Income.Group~.,data = train,method = "class",
control= rpart.control(minsplit = 20,minbucket = 100,maxdepth = 10),
xval = 5)
factor Workclass has new levels Local-gov, Self-emp-inc, State-gov, Without-pay