R 错误:变量‘;hashtags’‘;数字’;使用与fit不同的类型指定

R 错误:变量‘;hashtags’‘;数字’;使用与fit不同的类型指定,r,machine-learning,R,Machine Learning,对于R来说是新手,所以我有一个家庭作业任务来预测垃圾邮件/非垃圾邮件数据,我收到了测试数据和培训数据,它们都有相同的标签,我从培训数据集中训练了最后一个标签,即垃圾邮件/非垃圾邮件,但是当我尝试预测测试时,我得到了“错误:变量‘hashtags’、‘digits’的指定类型与fit不同。”。我应该使用什么来指定数据集是否为垃圾邮件 colnames(testing_data2) <- c( "age", "followers", "following", "userfav", "list"

对于R来说是新手,所以我有一个家庭作业任务来预测垃圾邮件/非垃圾邮件数据,我收到了测试数据和培训数据,它们都有相同的标签,我从培训数据集中训练了最后一个标签,即垃圾邮件/非垃圾邮件,但是当我尝试预测测试时,我得到了“错误:变量‘hashtags’、‘digits’的指定类型与fit不同。”。我应该使用什么来指定数据集是否为垃圾邮件

colnames(testing_data2) <- c(
"age",
"followers",
"following",
"userfav",
"list",
"tweets",
"retweets",
"tweetfav",
"hashtags",
"usermentions",
"urls",
"chars",
"digits",
"classification"            
)

colnames(testing_data2)也许您可以在公式之外准备数据,并尝试使用“干净”的名称,例如`classification~。
?确保类型与
testing_data2`和
training_data
匹配。在test2中,数字和哈希标记是系数w/14级别“0”、“1”、“11”、“12”“,..:2 2 1 2 1当训练为int时,如何将test2更改为int?您可以尝试
as.numeric(as.character(x))
colnames(training_data) <- c(
"age",
"followers",
"following",
"userfav",
"list",
"tweets",
"retweets",
"tweetfav",
"hashtags",
"usermentions",
"urls",
"chars",
"digits",
"classification"
)


rf_fit <- train(as.factor(classification) ~ .,
            data = training_data,
            method = "ranger")
rf_fit


testing_data2_rf_pred <- predict(rf_fit, testing_data2)  # error here