线性回归:使用SAS查找重要类别变量
我试图使用SAS来做一个非常基本的回归问题,但是我在得到完整的结果集时遇到了困难 我使用的数据集包括教授的整体素质(因变量),并包含以下自变量:性别、努迈尔、胡椒、纪律、易受性和利率 我正在使用下面的代码生成对数据集的分析:线性回归:使用SAS查找重要类别变量,sas,regression,linear-regression,p-value,Sas,Regression,Linear Regression,P Value,我试图使用SAS来做一个非常基本的回归问题,但是我在得到完整的结果集时遇到了困难 我使用的数据集包括教授的整体素质(因变量),并包含以下自变量:性别、努迈尔、胡椒、纪律、易受性和利率 我正在使用下面的代码生成对数据集的分析: proc glm data=WORK.IMPORT; class gender pepper discipline; model quality = gender numYears pepper discipline easiness raterIntere
proc glm data=WORK.IMPORT;
class gender pepper discipline;
model quality = gender numYears pepper discipline easiness raterInterest;
run;
我得到了以下结果,这正是我所需要的,除了我想确切地看到来自班级变量(性别、胡椒、纪律)的哪些反应是重要的。
从这些结果中,我可以看出轻松、利率、花椒和纪律是显著的;然而,我想看看胡椒和纪律的哪些具体价值是重要的。例如,pepper被学生回答为“是”或“否”。我想看看质量是否与pepperyes或pepperno相关。有谁能给我一些关于如何修改代码以返回类变量分解的建议吗
以下是数据集的链接,以备参考:
我真的非常感谢您的帮助 将
解决方案
选项添加到模型
语句中,以分解每个类变量的统计信息;但是,参考参数化在proc glm
中不可用,并且会导致偏差估计。有办法继续使用proc glm
,但最简单的解决方案是使用proc glmselect
proc glmselect
允许您指定参考参数化。使用selection=none
选项禁用变量选择
proc glmselect data=WORK.IMPORT;
class gender(ref='female') pepper discipline / param=reference;
model quality = gender numYears pepper discipline easiness raterInterest / selection=none;
run;
对此的解释是:
所有其他变量保持不变,女性通过
-与男性相比为0.046782单位。该变量在统计上不显著
每个级别的细分是与参考值的比较。默认情况下,选定的参考值是所有类值内部排序后的最后一级。可以在每个类变量之后使用ref=
选项指定引用。例如,如果要使用女性而不是男性作为参考值:
proc glmselect data=WORK.IMPORT;
class gender(ref='female') pepper discipline;
model quality = gender numYears pepper discipline easiness raterInterest / selection=none;
run;
请注意,您也可以使用prox mixed
执行此操作。为此,首选项取决于您喜欢的输出样式proc mixed
是一种更灵活的运行回归的方法,但在这里有点过火
proc mixed data=import;
class gender pepper discipline;
model quality = gender numYears pepper discipline easiness raterInterest / solution;
run;