R 用NA替换因子级别的不需要的值

R 用NA替换因子级别的不需要的值,r,na,r-factor,R,Na,R Factor,我有一个大数据框,其中包含空白缺失值和NA。 执行summary(factor(df$col))会给我一些 A 123 B 50000 90000 C 26000 NA's 12476 (注意 50000 < /代码>后的空白)< BR> 和sum(is.na(df$col))是12476,与na的数量相同,但我希望它是空格和nas的总和。 我试图通过执行 级别(df$col)尝试以下操作: df <- data.frame(a=11:18, col=c

我有一个大数据框,其中包含空白缺失值和NA。 执行summary(factor(df$col))会给我一些

A  
123  
B  
50000  

90000  
C  
26000
NA's  
12476  

(注意<代码> 50000 < /代码>后的空白)< BR> 和

sum(is.na(df$col))
是12476,与
na
的数量相同,但我希望它是空格和
na
s的总和。
我试图通过执行
级别(df$col)尝试以下操作:

df <- data.frame(a=11:18, col=c("C", "", "A", NA, "A", "", "C", NA))
levels(df$col) # ""  "A" "C"
sum(is.na(df$col)) # 2

df$col <- factor(df$col, levels=LETTERS[1:3])
levels(df$col) # "A" "B" "C"
sum(is.na(df$col)) # 4

df不幸的是,这对我不起作用,因为我的因子水平实际上没有被称为A:C。我尝试了水平的等价物(df$col)好的,我做了水平(df$col)