线性回归：使用SAS查找重要类别变量_Sas_Regression_Linear Regression_P Value

线性回归：使用SAS查找重要类别变量

sas

线性回归：使用SAS查找重要类别变量,sas,regression,linear-regression,p-value,Sas,Regression,Linear Regression,P Value,我试图使用SAS来做一个非常基本的回归问题，但是我在得到完整的结果集时遇到了困难我使用的数据集包括教授的整体素质（因变量），并包含以下自变量：性别、努迈尔、胡椒、纪律、易受性和利率我正在使用下面的代码生成对数据集的分析： proc glm data=WORK.IMPORT; class gender pepper discipline; model quality = gender numYears pepper discipline easiness raterIntere

我试图使用SAS来做一个非常基本的回归问题，但是我在得到完整的结果集时遇到了困难

我使用的数据集包括教授的整体素质（因变量），并包含以下自变量：性别、努迈尔、胡椒、纪律、易受性和利率

我正在使用下面的代码生成对数据集的分析：

proc glm data=WORK.IMPORT;
    class gender pepper discipline;
    model quality = gender numYears pepper discipline easiness raterInterest;
run;

我得到了以下结果，这正是我所需要的，除了我想确切地看到来自班级变量（性别、胡椒、纪律）的哪些反应是重要的。

从这些结果中，我可以看出轻松、利率、花椒和纪律是显著的；然而，我想看看胡椒和纪律的哪些具体价值是重要的。例如，pepper被学生回答为“是”或“否”。我想看看质量是否与pepperyes或pepperno相关。有谁能给我一些关于如何修改代码以返回类变量分解的建议吗

以下是数据集的链接，以备参考：

我真的非常感谢您的帮助

将

解决方案

选项添加到

模型

语句中，以分解每个类变量的统计信息；但是，参考参数化在

proc glm

中不可用，并且会导致偏差估计。有办法继续使用

proc glm

，但最简单的解决方案是使用

proc glmselect

proc glmselect

允许您指定参考参数化。使用

selection=none

选项禁用变量选择

proc glmselect data=WORK.IMPORT;
    class gender(ref='female') pepper discipline / param=reference;
    model quality = gender numYears pepper discipline easiness raterInterest / selection=none;
run;

对此的解释是：

所有其他变量保持不变，女性通过 -与男性相比为0.046782单位。该变量在统计上不显著

每个级别的细分是与参考值的比较。默认情况下，选定的参考值是所有类值内部排序后的最后一级。可以在每个类变量之后使用

ref=

选项指定引用。例如，如果要使用女性而不是男性作为参考值：

proc glmselect data=WORK.IMPORT;
    class gender(ref='female') pepper discipline;
    model quality = gender numYears pepper discipline easiness raterInterest / selection=none;
run;

请注意，您也可以使用

prox mixed

执行此操作。为此，首选项取决于您喜欢的输出样式

proc mixed

是一种更灵活的运行回归的方法，但在这里有点过火

proc mixed data=import;
    class gender pepper discipline;
    model quality = gender numYears pepper discipline easiness raterInterest / solution;
run;