R-生成一个;缺少变量“的值”;
我正在使用R为我所教的统计学课程生成如何处理缺失数据的示例。一种方法要求生成“缺失值二进制变量”,0表示缺失值,1表示不缺失值。比如说R-生成一个;缺少变量“的值”;,r,missing-data,dummy-data,R,Missing Data,Dummy Data,我正在使用R为我所教的统计学课程生成如何处理缺失数据的示例。一种方法要求生成“缺失值二进制变量”,0表示缺失值,1表示不缺失值。比如说 n X Y Z 1 4 300 2 2 8 400 4 3 10 500 7 4 18 NA 10 5 20 50 NA 6 NA 1000 5 我想生成一个变量M,这样 n m 1 1 2 1 3 1 4 0 5 0 6 0 考虑到R处理缺失值的能力,这似乎应
n X Y Z
1 4 300 2
2 8 400 4
3 10 500 7
4 18 NA 10
5 20 50 NA
6 NA 1000 5
我想生成一个变量M,这样
n m
1 1
2 1
3 1
4 0
5 0
6 0
考虑到R处理缺失值的能力,这似乎应该很简单。我找到的最接近的是
mcomplete.cases
正是你想要的
complete.cases(x)
## [1] TRUE TRUE TRUE FALSE FALSE FALSE
您可以强制为数字或整数:
as.integer(complete.cases(x))
## [1] 1 1 1 0 0 0
谢谢,这真是个好主意!作为更新,我正在实施Rubin的t检验。这是我生成的代码。数据集是“missgunts”(“guns”数据集,但我包含了缺少的值),其中一个变量是“urban”。丢失的