Sas 确定类别变量缺失的性质

Sas 确定类别变量缺失的性质,sas,missing-data,categorical-data,method-missing,Sas,Missing Data,Categorical Data,Method Missing,你能给我一些提示来识别分类变量缺失值的缺失性质吗?我的意思是,我在google scholar上进行了快速搜索,但没有找到任何与此相关的内容。我如何理解缺失值是否完全随机缺失,是随机缺失还是最终不是随机缺失?除了研究这个领域,我什么都想不出来。感谢您提供一些论文的链接,提前感谢。 (我将在sas环境中添加它,但问题与此语言没有具体关系)。既然您已将其标记为sas,您可以采取的一种方法是为每个分类变量创建一个布尔变量,指示它在每一行中是否缺少值。然后,您可以使用标志对缺失值的频率进行任意分析。例如

你能给我一些提示来识别分类变量缺失值的缺失性质吗?我的意思是,我在google scholar上进行了快速搜索,但没有找到任何与此相关的内容。我如何理解缺失值是否完全随机缺失,是随机缺失还是最终不是随机缺失?除了研究这个领域,我什么都想不出来。感谢您提供一些论文的链接,提前感谢。
(我将在sas环境中添加它,但问题与此语言没有具体关系)。

既然您已将其标记为sas,您可以采取的一种方法是为每个分类变量创建一个布尔变量,指示它在每一行中是否缺少值。然后,您可以使用标志对缺失值的频率进行任意分析。例如,您可以使用
proc corr
查看一个变量的缺失值是否与其他变量的值相关

例如,假设您遇到这样的情况:

data example;
    set sashelp.class;
    if AGE > 14 then call missing(SEX);
    SEX_MISSING_FLAG = missing(SEX);
run;
然后,您可以通过运行以下命令来发现它:

proc corr data = example outp= corr;
    var age weight height sex_missing_flag;
run;
输出:

_TYPE_,_NAME_,Age,Weight,Height,SEX_MISSING_FLAG
MEAN,,13.32,100.03,62.34,0.26
STD,,1.49,22.77,5.13,0.45
N,,19.00,19.00,19.00,19.00
CORR,Age,1.00,0.74,0.81,0.78
CORR,Weight,0.74,1.00,0.88,0.64
CORR,Height,0.81,0.88,1.00,0.55
CORR,SEX_MISSING_FLAG,0.78,0.64,0.55,1.00

欢迎这似乎更适合(统计网站)而不是这里(编程网站)。感谢您的欢迎和提示!我也会尝试一下:)好的,但不要交叉发布(同时在两个网站上发布);可能最好删除这一条,并将其发布到那里。虽然这对于CV来说绝对是一个更好的问题(因为它没有询问具体的实施情况),但对于该网站来说,这也不是一个好问题,因为它目前被问到了。最好是花些时间理解MCAR等,然后针对您正在理解的问题提出更具体的问题。感谢try@user667489,但proc corr不适用于分类变量(多层次和傻瓜)。如果要像连续变量那样管理分类变量,代码proc corr将起作用,但不会产生任何有用的结果。这是因为应用于分类变量的线性关联是没有意义的。这不是最复杂的示例,但我认为上面的代码演示了您可能发现的类型。