R 为什么在我的目标类中将空字符串作为额外因素？_R_Machine Learning

R 为什么在我的目标类中将空字符串作为额外因素？

r machine-learning

R 为什么在我的目标类中将空字符串作为额外因素？,r,machine-learning,R,Machine Learning,我正在编写代码，在测试数据集上测试一组机器学习模型。我的目标类中的一些行有空字符串，所以我编写了一些代码来删除这些行 data <- read.csv("ML17-TP2-train.csv", header = TRUE) filtered_data <- data[!(data$gender==" " | data$gender==""),] train_data <- filtered_data[1:1200, c(3,4,6,7,8)] test_data <-

我正在编写代码，在测试数据集上测试一组机器学习模型。我的目标类中的一些行有空字符串，所以我编写了一些代码来删除这些行

data <- read.csv("ML17-TP2-train.csv", header = TRUE)
filtered_data <- data[!(data$gender==" " | data$gender==""),]
train_data <- filtered_data[1:1200, c(3,4,6,7,8)]
test_data <- filtered_data[15001:17000, c(3,4,6,7,8)]

当我尝试检查nb的因素数量时

test.gender <- as.factor(nb.data$gender)

test.gender筛选出的数据只准确地筛选出“
和”
，而不是“
或”\n“
，等等@Xorifelse我需要做什么才能筛选出空字符串？@Xorifelse我只有两个类，我知道它们是什么。在excel中进行筛选并尝试运行我的模型时，我也会遇到相同的错误。您可以尝试read.csv（）
中的strip.white，或者将“筛选的数据”更改为仅提取两种指定的性别。
> performance(nb.predict, measures = auc)
auc 
NA 

test.gender <- as.factor(nb.data$gender)