检查分配给分类变量的伪变量R的值
这可能是一个非常基本的问题,但我正在进行回归分析,将性别作为感兴趣的变量之一。在我的数据集中,只有两个级别的性别,男性和女性。我的理解是R会自动为这个分类变量分配一个伪值,0或1。我如何知道男性或女性被分配为“1” 我尝试使用contrasts()函数,但它输出了检查分配给分类变量的伪变量R的值,r,statistics,dummy-variable,R,Statistics,Dummy Variable,这可能是一个非常基本的问题,但我正在进行回归分析,将性别作为感兴趣的变量之一。在我的数据集中,只有两个级别的性别,男性和女性。我的理解是R会自动为这个分类变量分配一个伪值,0或1。我如何知道男性或女性被分配为“1” 我尝试使用contrasts()函数,但它输出了 > contrasts(df_logistic$gender) Female Male 0 0 Female 1 0 Male 0 1 默认
> contrasts(df_logistic$gender)
Female Male
0 0
Female 1 0
Male 0 1
默认情况下,第一个因子级别为参考级别,因此在二元变量的情况下,另一个级别在模型矩阵中被指定为1。但是,对比显示您的性别变量有三个级别(运行
nlevels(df\u logistic$gender)
和级别(df\u logistic$gender)
)。您将看到有一个额外的空级别“
,您可能打算将其设置为NA
。您可能还想看看。