R?中线性回归中的二元变量?
我有一个二元变量(生物性别),我关心线性回归中估计值的正负号。在我的R?中线性回归中的二元变量?,r,regression,R,Regression,我有一个二元变量(生物性别),我关心线性回归中估计值的正负号。在我的data.frame中,女性编码为2,男性编码为1。我正在考虑重新编码,这样女性编码为0,男性编码为1 在这两种情况下,我如何解释估算的符号?例如,如果我的结果是身高,如果女性为0,男性为1,我会期望一个正值。但是,如果女性是2,男性是1,我不认为身高的结果是负的吗 提前感谢您的帮助! 查理我认为你的说法是正确的。如果不想重新编码变量,只需在公式本身中使用as.factor(sex)。Than R知道该值不是numeric,您不
data.frame
中,女性编码为2,男性编码为1。我正在考虑重新编码,这样女性编码为0,男性编码为1
在这两种情况下,我如何解释估算的符号?例如,如果我的结果是身高,如果女性为0,男性为1,我会期望一个正值。但是,如果女性是2,男性是1,我不认为身高的结果是负的吗
提前感谢您的帮助!
查理我认为你的说法是正确的。如果不想重新编码变量,只需在公式本身中使用
as.factor(sex)
。Than R知道该值不是numeric,您不必担心变量的编码
让我知道这是否有帮助,或者您是否有更多的问题:)将性别作为分类变量(class
factor
)。然后R将指定该值对应的性别
set.seed(1234)
x = data.frame(sex = factor(sample(c("female", "male"), size = 20, replace = TRUE)),
var = rnorm(20))
lm(var ~ sex, x)
# Call:
# lm(formula = var ~ sex, data = x)
# Coefficients:
# (Intercept) sexmale
# -0.31066 0.08228
这意味着在男性中,变量
var
中的值增加。我投票结束这个问题,因为它与帮助中心定义的编程无关。谢谢!这很好:)你能接受awnser是“最好的”吗,所以其他看到这一点的人,也有同样的问题,知道它是有效的吗?gotchu,谢谢你指出这一点