R 如何计算数据集中NA值的数量？_R

R 如何计算数据集中NA值的数量？

R 如何计算数据集中NA值的数量？,r,R,我如何知道一个数据集中有多少个值是NA？或者数据集中是否有任何NAs和NAN？正如@Roland所注意到的，有多个函数用于查找和处理R中缺失的值（请参见帮助（“NA”）和）例如：使用一些NA创建假数据集： data <- matrix(1:300,,3) data[sample(300, 40)] <- NA 按列检查是否有任何缺失值： anyNA(data) apply(data, 2, anyNA) 检查列中缺失值的百分比和计数： colMeans(is.na(data

我如何知道一个数据集中有多少个值是NA？或者数据集中是否有任何NAs和NAN？

正如@Roland所注意到的，有多个函数用于查找和处理R中缺失的值（请参见

帮助（“NA”）

和）

例如：

使用一些

NA

创建假数据集：

data <- matrix(1:300,,3)
data[sample(300, 40)] <- NA

按列检查是否有任何缺失值：

anyNA(data)

apply(data, 2, anyNA)

检查列中缺失值的百分比和计数：

colMeans(is.na(data))*100
colSums(is.na(data))

这也可以很好地工作

sum(is.na(df)) #  For entire dataset

对于数据集中的特定列

sum(is.na(df$col1))

或者检查@nicola提到的所有列

colSums(is.na(df))

anyNA

、

complete.cases

和

na.omit

都是有用的函数。你的问题不是很具体，也没有明确的主题。R中没有名为anyNA的函数。你能告诉我你是如何使用它的吗？如果你的R版本中没有

anyNA

，您应该更新R。我投票将此问题作为离题问题结束，因为这是关于使用R的基本问题。请参阅帮助中心中有关软件相关问题的建议。我投票将此问题作为离题问题结束，因为它是关于如何在没有可复制示例的情况下使用R。不需要时不要使用

apply

。只需

colSums（is.na（data））

就可以了。