R 用NA替换因子级别的不需要的值
我有一个大数据框,其中包含空白缺失值和NA。 执行summary(factor(df$col))会给我一些R 用NA替换因子级别的不需要的值,r,na,r-factor,R,Na,R Factor,我有一个大数据框,其中包含空白缺失值和NA。 执行summary(factor(df$col))会给我一些 A 123 B 50000 90000 C 26000 NA's 12476 (注意 50000 < /代码>后的空白)< BR> 和sum(is.na(df$col))是12476,与na的数量相同,但我希望它是空格和nas的总和。 我试图通过执行 级别(df$col)尝试以下操作: df <- data.frame(a=11:18, col=c
A
123
B
50000
90000
C
26000
NA's
12476
(注意<代码> 50000 < /代码>后的空白)< BR> 和
sum(is.na(df$col))
是12476,与na
的数量相同,但我希望它是空格和na
s的总和。我试图通过执行
级别(df$col)尝试以下操作:
df <- data.frame(a=11:18, col=c("C", "", "A", NA, "A", "", "C", NA))
levels(df$col) # "" "A" "C"
sum(is.na(df$col)) # 2
df$col <- factor(df$col, levels=LETTERS[1:3])
levels(df$col) # "A" "B" "C"
sum(is.na(df$col)) # 4
df不幸的是,这对我不起作用,因为我的因子水平实际上没有被称为A:C。我尝试了水平的等价物(df$col)好的,我做了水平(df$col)