R中每列中缺少的值数
我使用的是来自卡格尔的泰坦尼克号数据。我尝试使用一个简单的函数来查找每列中缺少的值的数量 我能够使用以下代码找到每列缺少的值的数量:R中每列中缺少的值数,r,R,我使用的是来自卡格尔的泰坦尼克号数据。我尝试使用一个简单的函数来查找每列中缺少的值的数量 我能够使用以下代码找到每列缺少的值的数量: length(which(is.na(titanic_data$PassengerId))) length(which(is.na(titanic_data$Survived))) length(which(is.na(titanic_data$Pclass))) length(which(is.na(titanic_data$Name))) length(whi
length(which(is.na(titanic_data$PassengerId)))
length(which(is.na(titanic_data$Survived)))
length(which(is.na(titanic_data$Pclass)))
length(which(is.na(titanic_data$Name)))
length(which(is.na(titanic_data$Sex)))
length(which(is.na(titanic_data$Age)))
length(which(is.na(titanic_data$SibSp)))
length(which(is.na(titanic_data$Parch)))
length(which(is.na(titanic_data$Ticket)))
length(which(is.na(titanic_data$Fare)))
length(which(is.na(titanic_data$Cabin)))
length(which(is.na(titanic_data$Embarked)))
我不想为每一列重复代码。因此,我编写了以下函数:
missing_val<- function(x,y){
len <-length(which(is.na(x$y)))
len
}
#create a list of all column names
cols<- colnames(titanic_data)
cols
#call the function
missing_val(titanic_data,cols)
missing_val您可以使用sapply
library(titanic)
data(titanic_train)
sapply(titanic_train, function(x) sum(is.na(x)))
PassengerId Survived Pclass Name Sex Age
0 0 0 0 0 177
SibSp Parch Ticket Fare Cabin Embarked
0 0 0 0 0 0
如果我没有弄错的话,sapply
没有矢量化。可以直接使用colSums
和is.na
>>> colSums(is.na(titanic_train))
更多的方法来做到这一点:感谢一个伟大的资源@Uwe发布此函数是为了在另一个问题中找到唯一值和NA值作为注释:totaluniquevals