如何解释R中的TukeyHSD输出?(与基础回归模型相关)
我建立了一个简单的线性回归模型,以“分数”作为因变量,“活动”作为自变量“活动”有5个级别:“侦听”(参考级别)、“读取1”、“读取2”、“监视1”、“监视2”如何解释R中的TukeyHSD输出?(与基础回归模型相关),r,linear-regression,tukey,R,Linear Regression,Tukey,我建立了一个简单的线性回归模型,以“分数”作为因变量,“活动”作为自变量“活动”有5个级别:“侦听”(参考级别)、“读取1”、“读取2”、“监视1”、“监视2” Call: lm(formula = Score ~ Activity) Residuals: Min 1Q Median 3Q Max -22.6154 -8.6154 -0.6154 7.1346 31.3846 Coefficients:
Call:
lm(formula = Score ~ Activity)
Residuals:
Min 1Q Median 3Q Max
-22.6154 -8.6154 -0.6154 7.1346 31.3846
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 41.615 2.553 16.302 <2e-16 ***
Activityread1 6.385 7.937 0.804 0.4254
Activityread2 20.885 9.552 2.186 0.0340 *
Activitywatch1 3.885 4.315 0.900 0.3728
Activitywatch2 -11.415 6.357 -1.796 0.0792 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 13.02 on 45 degrees of freedom
Multiple R-squared: 0.1901, Adjusted R-squared: 0.1181
F-statistic: 2.64 on 4 and 45 DF, p-value: 0.04594
在您的初始模型摘要中,
估计值
显示了各组相对于“倾听”组平均值的平均值的估计差异(40.615)。当仅计算这4个比较时,“read2”组与“listen”组的最大偏移(+20.885)被称为显著偏移(p=.0340)
由于TUKEYHSD
正在执行组平均值的所有成对比较(不再只是参考水平“倾听”),因此它也在执行p值调整,以考虑所有这些额外测试。原因是,如果你对随机数据进行了20次比较,你会期望一次(1/20或.05)被称为显著的p<0.05
,仅仅是因为做了那么多的测试。考虑到p值调整因素,您最初在“listen-read2”之间进行的显著比较不再具有显著性
但“watch2-read2”(-32.3)之间的较大差异(未在原始模型摘要中进行测试)足够大,即使在进行了所有额外的比较调整后,p=.03688
也被认为是显著的
希望对您有所帮助,您可以阅读更多有关多重比较问题的信息
. 请参见
?p.adjust
,了解R对最流行方法的实现。关于模型的报告,我应该报告什么?我应该只考虑TukeyHSD输出吗?这取决于你的研究/假设是什么,我猜这个想法是阅读和观看组比听组表现更好(更多参与)。如果您所关心的只是从listen基线得到的改进,那么忽略TukeyHSD结果并报告模型中的p值