R-生成一个;缺少变量“的值”;

R-生成一个;缺少变量“的值”;,r,missing-data,dummy-data,R,Missing Data,Dummy Data,我正在使用R为我所教的统计学课程生成如何处理缺失数据的示例。一种方法要求生成“缺失值二进制变量”,0表示缺失值,1表示不缺失值。比如说 n X Y Z 1 4 300 2 2 8 400 4 3 10 500 7 4 18 NA 10 5 20 50 NA 6 NA 1000 5 我想生成一个变量M,这样 n m 1 1 2 1 3 1 4 0 5 0 6 0 考虑到R处理缺失值的能力,这似乎应

我正在使用R为我所教的统计学课程生成如何处理缺失数据的示例。一种方法要求生成“缺失值二进制变量”,0表示缺失值,1表示不缺失值。比如说

n  X  Y    Z  
1  4  300  2  
2  8  400  4  
3  10 500  7  
4  18 NA   10  
5  20  50  NA  
6  NA 1000 5  
我想生成一个变量M,这样

n m  
1 1  
2 1   
3 1  
4 0  
5 0  
6 0  

考虑到R处理缺失值的能力,这似乎应该很简单。我找到的最接近的是
m
complete.cases
正是你想要的

complete.cases(x)
## [1]  TRUE  TRUE  TRUE FALSE FALSE FALSE
您可以强制为数字或整数:

as.integer(complete.cases(x))
## [1] 1 1 1 0 0 0

谢谢,这真是个好主意!作为更新,我正在实施Rubin的t检验。这是我生成的代码。数据集是“missgunts”(“guns”数据集,但我包含了缺少的值),其中一个变量是“urban”。丢失的