如何计算data.frame中特定变量的完整观测值

如何计算data.frame中特定变量的完整观测值,r,R,我有一个data.frame,有几百个变量,其中包含用NA表示的缺失值。总共有571次观测。我只对这个data.frame中的20个变量感兴趣。换句话说,我想把一个完整的观测定义为在所有20个感兴趣的变量中都有数据的任意观测 解决这个问题的一种方法是运行线性回归,它将删除任何缺少值的观测值。也就是说,它将陈述如下内容: (由于缺失删除了196个观察值) 这将允许我推断我的样本量等于571减去196。但一定有更好的办法。有什么想法吗 提前谢谢你 如果您只想删除任何变量中包含NA的任何观察值,请使用

我有一个
data.frame
,有几百个变量,其中包含用NA表示的缺失值。总共有571次观测。我只对这个
data.frame
中的20个变量感兴趣。换句话说,我想把一个完整的观测定义为在所有20个感兴趣的变量中都有数据的任意观测

解决这个问题的一种方法是运行线性回归,它将删除任何缺少值的观测值。也就是说,它将陈述如下内容:

(由于缺失删除了196个观察值)

这将允许我推断我的样本量等于571减去196。但一定有更好的办法。有什么想法吗


提前谢谢你

如果您只想删除任何变量中包含NA的任何观察值,请使用。如果您只想选择一些变量,请首先使用将其子集

例如:

#一些数据
DFA b c
#> 3 3 3 3
#> 4 4 4 4
#> 5 5 5 5
#仅使用“a”和“b”变量
省略(子集(df,select=c(“a”,“b”))
#>a b
#> 2 2 2
#> 3 3 3
#> 4 4 4
#> 5 5 5
由(v0.3.0)于2020年7月13日创建

您可以使用以下方法计算观察次数:


如果您只想删除任何变量中包含NA的任何观察值,请使用。如果您只想选择一些变量,请首先使用将其子集

例如:

#一些数据
DFA b c
#> 3 3 3 3
#> 4 4 4 4
#> 5 5 5 5
#仅使用“a”和“b”变量
省略(子集(df,select=c(“a”,“b”))
#>a b
#> 2 2 2
#> 3 3 3
#> 4 4 4
#> 5 5 5
由(v0.3.0)于2020年7月13日创建

您可以使用以下方法计算观察次数:


使用
完成。案例

df <- data.frame(
  a = c(1,NA,2,NA,3),
  b = c(NA,5,3,5,6),
  c = c(NA,NA,3,5,NA)
)

df[complete.cases(df),]
nrow(df[complete.cases(df),])

使用
完成。案例

df <- data.frame(
  a = c(1,NA,2,NA,3),
  b = c(NA,5,3,5,6),
  c = c(NA,NA,3,5,NA)
)

df[complete.cases(df),]
nrow(df[complete.cases(df),])

太棒了,谢谢你!对于其他人,我的最后一个代码是
nrow(na.omit(子集(finaldata,select=c(“child_age96”,“log3Tblood”)))
@goose144太好了,我很高兴它能工作!非常感谢您对其他人的反馈!太棒了,谢谢你!对于其他人,我的最后一个代码是
nrow(na.omit(子集(finaldata,select=c(“child_age96”,“log3Tblood”)))
@goose144太好了,我很高兴它能工作!非常感谢您对其他人的反馈!
 a b c
3 2 3 3

1