R 如何在样本量不等的情况下进行单因素方差分析?

R 如何在样本量不等的情况下进行单因素方差分析?,r,size,sample,anova,R,Size,Sample,Anova,试图学习R。一个来自旧统计文本的问题想知道不同建筑工地的休息时间是否有差异。问题是,文本决定每个站点雇用不同数量的工人。因此,我陷入困境,正在寻找使用不等样本量的方差分析的帮助 site1 <- c(34,25,27,31,26,34,21) site2 <- c(33,35,31,31,42,33) site3 <- c(17,30,30,26,32,28,26,29) site4 <- c(28,33,31,27,32,33,40) site1试试这个 site1

试图学习R。一个来自旧统计文本的问题想知道不同建筑工地的休息时间是否有差异。问题是,文本决定每个站点雇用不同数量的工人。因此,我陷入困境,正在寻找使用不等样本量的方差分析的帮助

site1 <- c(34,25,27,31,26,34,21)
site2 <- c(33,35,31,31,42,33)
site3 <- c(17,30,30,26,32,28,26,29)
site4 <- c(28,33,31,27,32,33,40)
site1试试这个

site1 <- c(34,25,27,31,26,34,21)
site2 <- c(33,35,31,31,42,33)
site3 <- c(17,30,30,26,32,28,26,29)
site4 <- c(28,33,31,27,32,33,40)

Data <- data.frame(
       Y=c(site1, site2, site3, site4),
       Site =factor(rep(c("site1", "site2", "site3", "site4"), times=c(length(site1), length(site2), length(site3), length(site4))))
       )
方差分析

fm1 <- aov(Y~Site, data=Data)
anova(fm1)

干得好。尽管您可能想提及导致OP失败的不相等样本大小并不重要,因为无论样本大小是否相等,方法都完全相同。
fm1 <- aov(Y~Site, data=Data)
anova(fm1)
Analysis of Variance Table

Response: Y
          Df Sum Sq Mean Sq F value  Pr(>F)  
Site       3 212.35  70.782  3.4971 0.03098 *
Residuals 24 485.76  20.240                  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1