R 试图建立一个基于分类的预测模型，以决定哪些客户将违约_R_Model

R 试图建立一个基于分类的预测模型，以决定哪些客户将违约

r model

R 试图建立一个基于分类的预测模型，以决定哪些客户将违约,r,model,R,Model,windows 10 rstudio 1.01.136 我一直在尝试建立一个模型，对将要违约或不违约的客户进行分类 prediction_test <- predict(train.tree,newdata = test ,type = "class") 那么，有谁能告诉我如何删除这个错误吗变量workclass只有5个值，即 as.matrix(prop.table(table(train$Workclass))) [,1] Federal

windows 10 rstudio 1.01.136 我一直在尝试建立一个模型，对将要违约或不违约的客户进行分类

prediction_test <- predict(train.tree,newdata = test ,type = "class")

那么，有谁能告诉我如何删除这个错误吗

变量workclass只有5个值，即

 as.matrix(prop.table(table(train$Workclass)))
                    [,1]
Federal-gov      0.02948
Never-worked     0.00021
others           0.13885
Private          0.75342
Self-emp-not-inc 0.07804

当我把其他人和其他人结合起来时，他们的比例就更小了

为了更清楚，我使用了决策树

library(rpart)
set.seed(333)
train.tree <- rpart(Income.Group~.,data = train,method = "class",
    control= rpart.control(minsplit = 20,minbucket = 100,maxdepth = 10),
    xval = 5)

我通过从测试数据中删除变量ID来纠正它

什么类型的对象是

train.tree

？

type=“workclass”

参数似乎不正确。这里不使用列名。那么您想要

type=“response”

？如果你能提供一个合适的答案，你会更容易得到帮助。我已经纠正了它。它实际上是一个类，我正试图用predict来预测function@MrFlick我已经纠正了它。它的类实际上是，我正在尝试使用预测函数进行预测。请看一看。对于错误，很抱歉，所以您仍然得到关于“Workclass.dummy”的错误？我不确定代码是否更清楚，因为在样本中，您预测的是“收入群体”，而我预期的是“工人阶级”。一个完全可复制的示例，带有样本输入数据，可以澄清问题。是的，我仍然得到错误。收入。组是依赖变量，我已经转换了工人阶级，因为一些值的比例小于5%。数据集非常大，我如何在这里共享32561 OB

library(rpart)
set.seed(333)
train.tree <- rpart(Income.Group~.,data = train,method = "class",
    control= rpart.control(minsplit = 20,minbucket = 100,maxdepth = 10),
    xval = 5)

factor Workclass has new levels Local-gov, Self-emp-inc, State-gov, Without-pay