Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/69.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在R中生成不同百分比的MAR数据_R_Regression_Missing Data - Fatal编程技术网

在R中生成不同百分比的MAR数据

在R中生成不同百分比的MAR数据,r,regression,missing-data,R,Regression,Missing Data,以下​ 两个R函数摘自《缺失数据的灵活插补》(第59和63页)。第一个生成完全随机缺失(MCAR)数据,第二个生成随机缺失(MAR)数据。这两个函数都提供了大约50%的缺失值。​ 在MCAR函数中,我们可以通过改变p值来生成不同百分比的缺失数据。但在MAR函数中,​我不明白​我们应该更改哪个参数以生成不同百分比的缺失数据,如10%或30% MCAR makemissing对于MCAR函数,每种情况下,观察缺失的概率为50%,因为根据定义,缺失是随机的。对于MAR版本,每个观测丢失观测的概率不同,

以下​ 两个R函数摘自《缺失数据的灵活插补》(第59和63页)。第一个生成完全随机缺失(MCAR)数据,第二个生成随机缺失(MAR)数据。这两个函数都提供了大约50%的缺失值。​

在MCAR函数中,我们可以通过改变p值来生成不同百分比的缺失数据。但在MAR函数中,​我不明白​我们应该更改哪个参数以生成不同百分比的缺失数据,如10%或30%

MCAR
makemissing对于MCAR函数,每种情况下,观察缺失的概率为50%,因为根据定义,缺失是随机的。对于MAR版本,每个观测丢失观测的概率不同,因为它取决于
y[,1]
的值。在代码中,
y[,2]
上的丢失概率保存在变量
p2.marright
中。通过将所有值排列在一个数据框中,您可能更容易看到这一点:

df <- data.frame(y1 = y[,1], y2_ori = y[,2], y2_mis = yobs[,2], p2.marright = p2.marright, r2.marright)
head(df)
        y1   y2_ori   y2_mis p2.marright r2.marright
1 2.086475 3.432803 3.432803   0.9485110           1
2 3.784675 5.005584 5.005584   0.7712399           1
3 4.818409 5.356688       NA   0.5452733           0
4 2.937422 3.898014 3.898014   0.8872124           1
5 6.422158 5.032659 5.032659   0.1943236           1
6 4.115106 5.083162 5.083162   0.7078354           1

df对于MCAR函数,每种情况下,观察缺失的概率为50%,因为根据定义,缺失是随机的。对于MAR版本,每个观测丢失观测的概率不同,因为它取决于
y[,1]
的值。在代码中,
y[,2]
上的丢失概率保存在变量
p2.marright
中。通过将所有值排列在一个数据框中,您可能更容易看到这一点:

df <- data.frame(y1 = y[,1], y2_ori = y[,2], y2_mis = yobs[,2], p2.marright = p2.marright, r2.marright)
head(df)
        y1   y2_ori   y2_mis p2.marright r2.marright
1 2.086475 3.432803 3.432803   0.9485110           1
2 3.784675 5.005584 5.005584   0.7712399           1
3 4.818409 5.356688       NA   0.5452733           0
4 2.937422 3.898014 3.898014   0.8872124           1
5 6.422158 5.032659 5.032659   0.1943236           1
6 4.115106 5.083162 5.083162   0.7078354           1

df有关缺失数据主题的信息覆盖,请参见Roderick J.A.Little和Donald B.Rubin(2002)Wiley的《缺失数据统计分析》第二版。有关缺失数据主题的信息覆盖,请参见Roderick J.A.Little和Donald B.Rubin(2002)的《缺失数据统计分析》第二版威利。@Shoheb如果这解决了你的问题,你可以接受它作为答案。@Shoheb如果这解决了你的问题,你可以接受它作为答案。
df <- data.frame(y1 = y[,1], y2_ori = y[,2], y2_mis = yobs[,2], p2.marright = p2.marright, r2.marright)
head(df)
        y1   y2_ori   y2_mis p2.marright r2.marright
1 2.086475 3.432803 3.432803   0.9485110           1
2 3.784675 5.005584 5.005584   0.7712399           1
3 4.818409 5.356688       NA   0.5452733           0
4 2.937422 3.898014 3.898014   0.8872124           1
5 6.422158 5.032659 5.032659   0.1943236           1
6 4.115106 5.083162 5.083162   0.7078354           1