在R中生成不同百分比的MAR数据
以下 两个R函数摘自《缺失数据的灵活插补》(第59和63页)。第一个生成完全随机缺失(MCAR)数据,第二个生成随机缺失(MAR)数据。这两个函数都提供了大约50%的缺失值。 在MCAR函数中,我们可以通过改变p值来生成不同百分比的缺失数据。但在MAR函数中,我不明白我们应该更改哪个参数以生成不同百分比的缺失数据,如10%或30% MCAR在R中生成不同百分比的MAR数据,r,regression,missing-data,R,Regression,Missing Data,以下 两个R函数摘自《缺失数据的灵活插补》(第59和63页)。第一个生成完全随机缺失(MCAR)数据,第二个生成随机缺失(MAR)数据。这两个函数都提供了大约50%的缺失值。 在MCAR函数中,我们可以通过改变p值来生成不同百分比的缺失数据。但在MAR函数中,我不明白我们应该更改哪个参数以生成不同百分比的缺失数据,如10%或30% MCAR makemissing对于MCAR函数,每种情况下,观察缺失的概率为50%,因为根据定义,缺失是随机的。对于MAR版本,每个观测丢失观测的概率不同,
makemissing对于MCAR函数,每种情况下,观察缺失的概率为50%,因为根据定义,缺失是随机的。对于MAR版本,每个观测丢失观测的概率不同,因为它取决于y[,1]
的值。在代码中,y[,2]
上的丢失概率保存在变量p2.marright
中。通过将所有值排列在一个数据框中,您可能更容易看到这一点:
df <- data.frame(y1 = y[,1], y2_ori = y[,2], y2_mis = yobs[,2], p2.marright = p2.marright, r2.marright)
head(df)
y1 y2_ori y2_mis p2.marright r2.marright
1 2.086475 3.432803 3.432803 0.9485110 1
2 3.784675 5.005584 5.005584 0.7712399 1
3 4.818409 5.356688 NA 0.5452733 0
4 2.937422 3.898014 3.898014 0.8872124 1
5 6.422158 5.032659 5.032659 0.1943236 1
6 4.115106 5.083162 5.083162 0.7078354 1
df对于MCAR函数,每种情况下,观察缺失的概率为50%,因为根据定义,缺失是随机的。对于MAR版本,每个观测丢失观测的概率不同,因为它取决于y[,1]
的值。在代码中,y[,2]
上的丢失概率保存在变量p2.marright
中。通过将所有值排列在一个数据框中,您可能更容易看到这一点:
df <- data.frame(y1 = y[,1], y2_ori = y[,2], y2_mis = yobs[,2], p2.marright = p2.marright, r2.marright)
head(df)
y1 y2_ori y2_mis p2.marright r2.marright
1 2.086475 3.432803 3.432803 0.9485110 1
2 3.784675 5.005584 5.005584 0.7712399 1
3 4.818409 5.356688 NA 0.5452733 0
4 2.937422 3.898014 3.898014 0.8872124 1
5 6.422158 5.032659 5.032659 0.1943236 1
6 4.115106 5.083162 5.083162 0.7078354 1
df有关缺失数据主题的信息覆盖,请参见Roderick J.A.Little和Donald B.Rubin(2002)Wiley的《缺失数据统计分析》第二版。有关缺失数据主题的信息覆盖,请参见Roderick J.A.Little和Donald B.Rubin(2002)的《缺失数据统计分析》第二版威利。@Shoheb如果这解决了你的问题,你可以接受它作为答案。@Shoheb如果这解决了你的问题,你可以接受它作为答案。
df <- data.frame(y1 = y[,1], y2_ori = y[,2], y2_mis = yobs[,2], p2.marright = p2.marright, r2.marright)
head(df)
y1 y2_ori y2_mis p2.marright r2.marright
1 2.086475 3.432803 3.432803 0.9485110 1
2 3.784675 5.005584 5.005584 0.7712399 1
3 4.818409 5.356688 NA 0.5452733 0
4 2.937422 3.898014 3.898014 0.8872124 1
5 6.422158 5.032659 5.032659 0.1943236 1
6 4.115106 5.083162 5.083162 0.7078354 1