在R中生成不同百分比的MAR数据_R_Regression_Missing Data

在R中生成不同百分比的MAR数据

在R中生成不同百分比的MAR数据,r,regression,missing-data,R,Regression,Missing Data,以下两个R函数摘自《缺失数据的灵活插补》（第59和63页）。第一个生成完全随机缺失（MCAR）数据，第二个生成随机缺失（MAR）数据。这两个函数都提供了大约50%的缺失值。在MCAR函数中，我们可以通过改变p值来生成不同百分比的缺失数据。但在MAR函数中，我不明白我们应该更改哪个参数以生成不同百分比的缺失数据，如10%或30% MCAR makemissing对于MCAR函数，每种情况下，观察缺失的概率为50%，因为根据定义，缺失是随机的。对于MAR版本，每个观测丢失观测的概率不同，

以下两个R函数摘自《缺失数据的灵活插补》（第59和63页）。第一个生成完全随机缺失（MCAR）数据，第二个生成随机缺失（MAR）数据。这两个函数都提供了大约50%的缺失值。

在MCAR函数中，我们可以通过改变p值来生成不同百分比的缺失数据。但在MAR函数中，我不明白我们应该更改哪个参数以生成不同百分比的缺失数据，如10%或30%

MCAR

makemissing对于MCAR函数，每种情况下，观察缺失的概率为50%，因为根据定义，缺失是随机的。对于MAR版本，每个观测丢失观测的概率不同，因为它取决于y[，1]
的值。在代码中，y[，2]
上的丢失概率保存在变量p2.marright
中。通过将所有值排列在一个数据框中，您可能更容易看到这一点：
df <- data.frame(y1 = y[,1], y2_ori = y[,2], y2_mis = yobs[,2], p2.marright = p2.marright, r2.marright)
head(df)
        y1   y2_ori   y2_mis p2.marright r2.marright
1 2.086475 3.432803 3.432803   0.9485110           1
2 3.784675 5.005584 5.005584   0.7712399           1
3 4.818409 5.356688       NA   0.5452733           0
4 2.937422 3.898014 3.898014   0.8872124           1
5 6.422158 5.032659 5.032659   0.1943236           1
6 4.115106 5.083162 5.083162   0.7078354           1

df对于MCAR函数，每种情况下，观察缺失的概率为50%，因为根据定义，缺失是随机的。对于MAR版本，每个观测丢失观测的概率不同，因为它取决于y[，1]
的值。在代码中，y[，2]
上的丢失概率保存在变量p2.marright
中。通过将所有值排列在一个数据框中，您可能更容易看到这一点：
df <- data.frame(y1 = y[,1], y2_ori = y[,2], y2_mis = yobs[,2], p2.marright = p2.marright, r2.marright)
head(df)
        y1   y2_ori   y2_mis p2.marright r2.marright
1 2.086475 3.432803 3.432803   0.9485110           1
2 3.784675 5.005584 5.005584   0.7712399           1
3 4.818409 5.356688       NA   0.5452733           0
4 2.937422 3.898014 3.898014   0.8872124           1
5 6.422158 5.032659 5.032659   0.1943236           1
6 4.115106 5.083162 5.083162   0.7078354           1

df有关缺失数据主题的信息覆盖，请参见Roderick J.A.Little和Donald B.Rubin（2002）Wiley的《缺失数据统计分析》第二版。有关缺失数据主题的信息覆盖，请参见Roderick J.A.Little和Donald B.Rubin（2002）的《缺失数据统计分析》第二版威利。@Shoheb如果这解决了你的问题，你可以接受它作为答案。@Shoheb如果这解决了你的问题，你可以接受它作为答案。
df <- data.frame(y1 = y[,1], y2_ori = y[,2], y2_mis = yobs[,2], p2.marright = p2.marright, r2.marright)
head(df)
        y1   y2_ori   y2_mis p2.marright r2.marright
1 2.086475 3.432803 3.432803   0.9485110           1
2 3.784675 5.005584 5.005584   0.7712399           1
3 4.818409 5.356688       NA   0.5452733           0
4 2.937422 3.898014 3.898014   0.8872124           1
5 6.422158 5.032659 5.032659   0.1943236           1
6 4.115106 5.083162 5.083162   0.7078354           1