R 如何计算数据集中NA值的数量?
我如何知道一个数据集中有多少个值是NA?或者数据集中是否有任何NAs和NAN?正如@Roland所注意到的,有多个函数用于查找和处理R中缺失的值(请参见R 如何计算数据集中NA值的数量?,r,R,我如何知道一个数据集中有多少个值是NA?或者数据集中是否有任何NAs和NAN?正如@Roland所注意到的,有多个函数用于查找和处理R中缺失的值(请参见帮助(“NA”)和) 例如: 使用一些NA创建假数据集: data <- matrix(1:300,,3) data[sample(300, 40)] <- NA 按列检查是否有任何缺失值: anyNA(data) apply(data, 2, anyNA) 检查列中缺失值的百分比和计数: colMeans(is.na(data
帮助(“NA”)
和)
例如:
使用一些NA
创建假数据集:
data <- matrix(1:300,,3)
data[sample(300, 40)] <- NA
按列检查是否有任何缺失值:
anyNA(data)
apply(data, 2, anyNA)
检查列中缺失值的百分比和计数:
colMeans(is.na(data))*100
colSums(is.na(data))
这也可以很好地工作
sum(is.na(df)) # For entire dataset
对于数据集中的特定列
sum(is.na(df$col1))
或者检查@nicola提到的所有列
colSums(is.na(df))
anyNA
、complete.cases
和na.omit
都是有用的函数。你的问题不是很具体,也没有明确的主题。R中没有名为anyNA的函数。你能告诉我你是如何使用它的吗?如果你的R版本中没有anyNA
,您应该更新R。我投票将此问题作为离题问题结束,因为这是关于使用R的基本问题。请参阅帮助中心中有关软件相关问题的建议。我投票将此问题作为离题问题结束,因为它是关于如何在没有可复制示例的情况下使用R。不需要时不要使用apply
。只需colSums(is.na(data))
就可以了。