R-';NA';视为不适用的文本
我有一个R格式的数据框,包括国家iso代码。纳米比亚的iso代码恰好是“NA”。R将此文本“不适用”视为不适用 例如,下面的代码给出了纳米比亚的行R-';NA';视为不适用的文本,r,text,na,R,Text,Na,我有一个R格式的数据框,包括国家iso代码。纳米比亚的iso代码恰好是“NA”。R将此文本“不适用”视为不适用 例如,下面的代码给出了纳米比亚的行 test <- subset(country.info,is.na(country.info$iso.code)) test这可能与您读取数据的方式有关。仅仅因为它是字符并不意味着你的“NA”不是NA,例如: z <- c("NA",NA,"US") class(z) #[1] "character" 确保检查“的使用不会导致更改任何
test <- subset(country.info,is.na(country.info$iso.code))
test这可能与您读取数据的方式有关。仅仅因为它是字符并不意味着你的“NA”
不是NA
,例如:
z <- c("NA",NA,"US")
class(z)
#[1] "character"
确保检查“
的使用不会导致更改任何其他内容。否则,您可以使用一个绝对不会出现在文件中的字符串,如“z_z_z”或类似的东西。。您可以用您的文件名替换文本=…
。如果Thomas的解决方案不起作用,您可以始终使用countrycode
包将您的countrycodes更改为导致较少问题的内容。
例如,在您的例子中,从ISO2字符到ISO3字符
country.info$iso.codeold回答新问题:是否可以为每列指定na.strings
?在一个表中(我们无法控制NA字符串的标识),可能存在具有真实NA值的数字列。如果能够抑制每列的NA解释,那就太好了…@dojuba我不这么认为。您可以查看readr::read_csv()
等是否支持这一点。
read.table(text="code country
NA Namibia
GR Germany
FR France", stringsAsFactors=FALSE, header=TRUE, na.strings="")
# code country
# 1 NA Namibia
# 2 GR Germany
# 3 FR France