Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/65.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R中每列中缺少的值数_R - Fatal编程技术网

R中每列中缺少的值数

R中每列中缺少的值数,r,R,我使用的是来自卡格尔的泰坦尼克号数据。我尝试使用一个简单的函数来查找每列中缺少的值的数量 我能够使用以下代码找到每列缺少的值的数量: length(which(is.na(titanic_data$PassengerId))) length(which(is.na(titanic_data$Survived))) length(which(is.na(titanic_data$Pclass))) length(which(is.na(titanic_data$Name))) length(whi

我使用的是来自卡格尔的泰坦尼克号数据。我尝试使用一个简单的函数来查找每列中缺少的值的数量

我能够使用以下代码找到每列缺少的值的数量:

length(which(is.na(titanic_data$PassengerId)))
length(which(is.na(titanic_data$Survived)))
length(which(is.na(titanic_data$Pclass)))
length(which(is.na(titanic_data$Name)))
length(which(is.na(titanic_data$Sex)))
length(which(is.na(titanic_data$Age)))
length(which(is.na(titanic_data$SibSp)))
length(which(is.na(titanic_data$Parch)))
length(which(is.na(titanic_data$Ticket)))
length(which(is.na(titanic_data$Fare)))
length(which(is.na(titanic_data$Cabin)))
length(which(is.na(titanic_data$Embarked)))
我不想为每一列重复代码。因此,我编写了以下函数:

missing_val<- function(x,y){
  len <-length(which(is.na(x$y)))
  len
}

#create a list of all column names
cols<- colnames(titanic_data)
cols

#call the function
missing_val(titanic_data,cols)

missing_val您可以使用
sapply

library(titanic)
data(titanic_train)
sapply(titanic_train, function(x) sum(is.na(x)))
PassengerId    Survived      Pclass        Name         Sex         Age 
          0           0           0           0           0         177 
      SibSp       Parch      Ticket        Fare       Cabin    Embarked 
          0           0           0           0           0           0 

如果我没有弄错的话,
sapply
没有矢量化。可以直接使用
colSums
is.na

>>> colSums(is.na(titanic_train))

更多的方法来做到这一点:感谢一个伟大的资源@Uwe发布此函数是为了在另一个问题中找到唯一值和NA值作为注释:
totaluniquevals