R中缺少值的子集变量

R中缺少值的子集变量,r,R,我有一个包含50个变量(列)的数据集,其中30个变量的缺失值超过其自身观察值的一半 我想对一个数据集进行子集,其中包含太多缺失值的30个变量都消失了。我想我可以一个接一个地做,但我只是想知道是否有一种方法可以在R中更快地完成。逻辑:首先使用sapply遍历每一列,并检查所有列的缺失值是否都少于一半。第一行的输出是一个逻辑向量,用于将数据子集 ind <- sapply( colnames(df), function(x) sum(is.na(df[[x]])) < nrow(df)/

我有一个包含50个变量(列)的数据集,其中30个变量的缺失值超过其自身观察值的一半


我想对一个数据集进行子集,其中包含太多缺失值的30个变量都消失了。我想我可以一个接一个地做,但我只是想知道是否有一种方法可以在R中更快地完成。逻辑:首先使用
sapply
遍历每一列,并检查所有列的缺失值是否都少于一半。第一行的输出是一个逻辑向量,用于将数据子集

ind <- sapply( colnames(df), function(x) sum(is.na(df[[x]])) < nrow(df)/2)
df <- df[colnames(df)[ind]]

ind@JunNo用你的真实数据回答了这个问题吗?介意接受这个吗?