R 为什么在我的目标类中将空字符串作为额外因素?

R 为什么在我的目标类中将空字符串作为额外因素?,r,machine-learning,R,Machine Learning,我正在编写代码,在测试数据集上测试一组机器学习模型。我的目标类中的一些行有空字符串,所以我编写了一些代码来删除这些行 data <- read.csv("ML17-TP2-train.csv", header = TRUE) filtered_data <- data[!(data$gender==" " | data$gender==""),] train_data <- filtered_data[1:1200, c(3,4,6,7,8)] test_data <-

我正在编写代码,在测试数据集上测试一组机器学习模型。我的目标类中的一些行有空字符串,所以我编写了一些代码来删除这些行

data <- read.csv("ML17-TP2-train.csv", header = TRUE)
filtered_data <- data[!(data$gender==" " | data$gender==""),]
train_data <- filtered_data[1:1200, c(3,4,6,7,8)]
test_data <- filtered_data[15001:17000, c(3,4,6,7,8)]
当我尝试检查nb的因素数量时

test.gender <- as.factor(nb.data$gender)

test.gender筛选出的数据只准确地筛选出
,而不是
”\n“
,等等@Xorifelse我需要做什么才能筛选出空字符串?@Xorifelse我只有两个类,我知道它们是什么。在excel中进行筛选并尝试运行我的模型时,我也会遇到相同的错误。您可以尝试
read.csv()
中的
strip.white
,或者将“筛选的数据”更改为仅提取两种指定的性别。
> performance(nb.predict, measures = auc)
auc 
NA 
test.gender <- as.factor(nb.data$gender)