如何解释R中的TukeyHSD输出？（与基础回归模型相关）_R_Linear Regression_Tukey

如何解释R中的TukeyHSD输出？（与基础回归模型相关）

如何解释R中的TukeyHSD输出？（与基础回归模型相关）,r,linear-regression,tukey,R,Linear Regression,Tukey,我建立了一个简单的线性回归模型，以“分数”作为因变量，“活动”作为自变量“活动”有5个级别：“侦听”（参考级别）、“读取1”、“读取2”、“监视1”、“监视2” Call: lm(formula = Score ~ Activity) Residuals: Min 1Q Median 3Q Max -22.6154 -8.6154 -0.6154 7.1346 31.3846 Coefficients:

我建立了一个简单的线性回归模型，以“分数”作为因变量，“活动”作为自变量“活动”有5个级别：“侦听”（参考级别）、“读取1”、“读取2”、“监视1”、“监视2”

Call:
lm(formula = Score ~ Activity)

Residuals:
     Min       1Q   Median       3Q      Max 
-22.6154  -8.6154  -0.6154   7.1346  31.3846 

Coefficients:
               Estimate Std. Error t value Pr(>|t|)    
(Intercept)      41.615      2.553  16.302   <2e-16 ***
Activityread1     6.385      7.937   0.804   0.4254    
Activityread2    20.885      9.552   2.186   0.0340 *  
Activitywatch1    3.885      4.315   0.900   0.3728    
Activitywatch2  -11.415      6.357  -1.796   0.0792 .  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 13.02 on 45 degrees of freedom
Multiple R-squared:  0.1901,    Adjusted R-squared:  0.1181 
F-statistic:  2.64 on 4 and 45 DF,  p-value: 0.04594

在您的初始模型摘要中，

估计值

显示了各组相对于“倾听”组平均值的平均值的估计差异（40.615）。当仅计算这4个比较时，“read2”组与“listen”组的最大偏移（+20.885）被称为显著偏移（p=.0340）

由于

TUKEYHSD

正在执行组平均值的所有成对比较（不再只是参考水平“倾听”），因此它也在执行p值调整，以考虑所有这些额外测试。原因是，如果你对随机数据进行了20次比较，你会期望一次（1/20或.05）被称为显著的

p<0.05

，仅仅是因为做了那么多的测试。考虑到p值调整因素，您最初在“listen-read2”之间进行的显著比较不再具有显著性

但“watch2-read2”（-32.3）之间的较大差异（未在原始模型摘要中进行测试）足够大，即使在进行了所有额外的比较调整后，

p=.03688

也被认为是显著的

希望对您有所帮助，您可以阅读更多有关多重比较问题的信息

. 请参见

？p.adjust

，了解R对最流行方法的实现。

关于模型的报告，我应该报告什么？我应该只考虑TukeyHSD输出吗？这取决于你的研究/假设是什么，我猜这个想法是阅读和观看组比听组表现更好（更多参与）。如果您所关心的只是从listen基线得到的改进，那么忽略TukeyHSD结果并报告模型中的p值