R 在森林里种一棵树

R 在森林里种一棵树,r,warnings,decision-tree,na,R,Warnings,Decision Tree,Na,我是R的新手,我正在尝试建立一个决策树: 以下是我的一些数据集: Malo Edad Sexo nivel_estudios Estado Civil 1 35 Femenino Secundaria Union Libre 0 48 Femenino Bachillerato Casado 0 45 Masculino Bachillerato Casado 1

我是R的新手,我正在尝试建立一个决策树:

以下是我的一些数据集:

Malo   Edad   Sexo      nivel_estudios    Estado Civil
1       35    Femenino  Secundaria         Union Libre
0       48    Femenino  Bachillerato       Casado
0       45    Masculino Bachillerato       Casado
1       27    Femenino  Bachillerato       Union Libre
当我尝试执行这段代码时:

tree_model= tree(Malo~., trainingSet)
其中Malo是我的二进制(0/1)列(整数),它将对象分类为好的或坏的,而训练集是我的测试集的随机分区

我一直收到这样的警告:

Warning message:
In tree(Malo ~ ., trainingSet) : NAs introduced by coercion

我不明白为什么我会得到这个。非常感谢您的帮助。

公式

拟合回归树时,左侧(响应)应为数值向量,或生成分类树时为因子。右侧应为一系列数值或因子变量,以+分隔;不应该有交互术语。二者都和-是允许的:回归树可以有偏移项

介绍了NA的简单示例

as.numeric(c('1','b','2')) 
[1]  1 NA  2 
Warning message: 
NAs introduced by coercion 

希望您理解这个问题,您已经将
添加为数值
向量,并将
字符串的其余部分
(Sexo,nivel_estudios,Estado Civil)向量添加到公式树(Malo~,trainingSet)公式

拟合回归树时,左侧(响应)应为数值向量,或生成分类树时为因子。右侧应为一系列数值或因子变量,以+分隔;不应该有交互术语。二者都和-是允许的:回归树可以有偏移项

介绍了NA的简单示例

as.numeric(c('1','b','2')) 
[1]  1 NA  2 
Warning message: 
NAs introduced by coercion 

希望您能理解这个问题,您已经在公式
树(Malo~,trainingSet)
中添加了
作为数值
向量以及
字符串的其余部分
(Sexo,nivel_estudios,Estado Civil)向量。您可能希望对数据集的最后三列应用as.factor()函数。例如:

trainingSet$Sexo=as.factor(trainingSet$Sexo)

trainingSet$nivel\u estudios=as.factor(trainingSet$nivel\u estudios)

您可能需要将“Estado Civil”的列名更改为类似“EstadoCivil”或“Estado.Civil”的名称,以便我们也可以对其应用as.factor()函数


通过这种方式,我们可以满足“右侧应该是一系列数字或因子变量,以+”分隔”的条件。

您可能希望将as.factor()函数应用于数据集的最后三列。例如:

trainingSet$Sexo=as.factor(trainingSet$Sexo)

trainingSet$nivel\u estudios=as.factor(trainingSet$nivel\u estudios)

您可能需要将“Estado Civil”的列名更改为类似“EstadoCivil”或“Estado.Civil”的名称,以便我们也可以对其应用as.factor()函数

通过这种方式,我们可以满足标准“右侧应为一系列数字或因子变量,用+”分隔”

响应变量(Malo)应为“因子”,因此使用:

trainingSet$Malo响应变量(Malo)需要是“因子”,因此使用:


trainingSet$Malo您能告诉我吗?类(Malo)。您没有包含任何样本数据来解决此问题。请更新您的问题,否则我们无法提供帮助,只能提供随机猜测。添加了数据集@Aashu:类(Malo)是整数。你能告诉我吗?类(Malo)。你还没有包含任何样本数据来解决这个问题。请更新您的问题,否则我们无法提供帮助,只能提供随机猜测。添加了数据集@Aashu:class(Malo)是整数。