R中的伪变量

R中的伪变量,r,lm,dummy-variable,R,Lm,Dummy Variable,我正在构建一个线性模型来评估距离栖息地边界对昆虫数量的影响。使用的设备存在一些差异,因此我将设备作为一个分类变量,以确保其不会对丰富度产生重大影响 分类因子为3级,因此我要求r使用代码在lm中生成虚拟变量: lm(Richness ~ Distances + factor(Equipment), data = Data) 当我询问模型的摘要时,我可以看到其中两个级别及其系数。我假设这意味着r使用其中一个级别作为“标准”来比较其他级别的系数 我如何找到第三级的系数,以查看它对模型的影响 谢谢您

我正在构建一个线性模型来评估距离栖息地边界对昆虫数量的影响。使用的设备存在一些差异,因此我将设备作为一个分类变量,以确保其不会对丰富度产生重大影响

分类因子为3级,因此我要求r使用代码在lm中生成虚拟变量:

lm(Richness ~ Distances + factor(Equipment), data = Data) 
当我询问模型的摘要时,我可以看到其中两个级别及其系数。我假设这意味着r使用其中一个级别作为“标准”来比较其他级别的系数

我如何找到第三级的系数,以查看它对模型的影响


谢谢

您可以执行
lm(y~x-1)
删除截距,在您的情况下,截距是其中一个因素的参考水平。也就是说,使用其中一个级别作为参考是有统计原因的。

要确定如何提取系数,以下是一个简单的示例:

# load data 
data(mtcars)
head(mtcars)

# what are the means of wt given the factor carb?
(means <- with(mtcars, tapply(wt, factor(carb), mean)))

# run the lm
mod <- with(mtcars, lm(wt~factor(carb)))

# extract the coefficients
coef(mod)

# the intercept is the reference level (i.e., carb 1)
coef(mod)[1]
coef(mod)[2:6]
coef(mod)[1] + coef(mod)[2:6]
means
#加载数据
数据(mtcars)
车头(mtcars)
#考虑到因子carb,wt的平均值是多少?

(表示您已接受答案。这是否表示您了解如何处理结果?
mod2 <- lm(wt ~ factor(carb) + disp, data=mtcars)
summary(mod2)