Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/75.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 如何计算数据集中NA值的数量?_R - Fatal编程技术网

R 如何计算数据集中NA值的数量?

R 如何计算数据集中NA值的数量?,r,R,我如何知道一个数据集中有多少个值是NA?或者数据集中是否有任何NAs和NAN?正如@Roland所注意到的,有多个函数用于查找和处理R中缺失的值(请参见帮助(“NA”)和) 例如: 使用一些NA创建假数据集: data <- matrix(1:300,,3) data[sample(300, 40)] <- NA 按列检查是否有任何缺失值: anyNA(data) apply(data, 2, anyNA) 检查列中缺失值的百分比和计数: colMeans(is.na(data

我如何知道一个数据集中有多少个值是NA?或者数据集中是否有任何NAs和NAN?

正如@Roland所注意到的,有多个函数用于查找和处理R中缺失的值(请参见
帮助(“NA”)
和)

例如:

使用一些
NA
创建假数据集:

data <- matrix(1:300,,3)
data[sample(300, 40)] <- NA
按列检查是否有任何缺失值:

anyNA(data)
apply(data, 2, anyNA)
检查列中缺失值的百分比和计数:

colMeans(is.na(data))*100
colSums(is.na(data))

这也可以很好地工作

sum(is.na(df)) #  For entire dataset
对于数据集中的特定列

sum(is.na(df$col1)) 
或者检查@nicola提到的所有列

colSums(is.na(df))

anyNA
complete.cases
na.omit
都是有用的函数。你的问题不是很具体,也没有明确的主题。R中没有名为anyNA的函数。你能告诉我你是如何使用它的吗?如果你的R版本中没有
anyNA
,您应该更新R。我投票将此问题作为离题问题结束,因为这是关于使用R的基本问题。请参阅帮助中心中有关软件相关问题的建议。我投票将此问题作为离题问题结束,因为它是关于如何在没有可复制示例的情况下使用R。不需要时不要使用
apply
。只需
colSums(is.na(data))
就可以了。