R 我应该何时使用aov()和何时使用anova()?
我参考了很多网络文学作品,但这增加了我的困惑。大部分讨论都是关于不平衡设计和I、II或III因子方差分析等方面的技术性术语 我只知道,R 我应该何时使用aov()和何时使用anova()?,r,anova,R,Anova,我参考了很多网络文学作品,但这增加了我的困惑。大部分讨论都是关于不平衡设计和I、II或III因子方差分析等方面的技术性术语 我只知道,aov()在内部使用lm(),并且对于包含因子的数据非常有用。而anova()可用于同一数据集上的不同模型。 我的理解正确吗?anova与aov有很大不同。为什么不阅读R的文档?aov和?anova?简言之: aov拟合模型(如您所知,它在内部调用lm),因此它生成回归系数、拟合值、残差等;它生成一个主要类“aov”的对象,但也生成一个次要类“lm”。因此,它是
aov()
在内部使用lm()
,并且对于包含因子的数据非常有用。而anova()
可用于同一数据集上的不同模型。
我的理解正确吗?
anova
与aov
有很大不同。为什么不阅读R的文档?aov
和?anova
?简言之:
拟合模型(如您所知,它在内部调用aov
),因此它生成回归系数、拟合值、残差等;它生成一个主要类“aov”的对象,但也生成一个次要类“lm”。因此,它是对“lm”对象的扩充lm
是一个通用函数。在您的场景中,您指的是anova
或anova.lm
(有关更多信息,请阅读anova.lmlist
)。前者分析一个拟合模型(由?anova.lm
或lm
生成),而后者分析几个嵌套(越来越大)拟合模型(由aov
或lm
)。它们都旨在生成I型(顺序)方差分析表aov
lm
/aov
拟合模型,然后使用anova
分析结果。没有什么比尝试一个小例子更好的了:
fit <- aov(sr ~ ., data = LifeCycleSavings) ## can also use `lm`
z <- anova(fit)
而anova
返回:
str(z)
#Classes ‘anova’ and 'data.frame': 5 obs. of 5 variables:
# $ Df : int 1 1 1 1 45
# $ Sum Sq : num 204.1 53.3 12.4 63.1 650.7
# $ Mean Sq: num 204.1 53.3 12.4 63.1 14.5
# $ F value: num 14.116 3.689 0.858 4.36 NA
# $ Pr(>F) : num 0.000492 0.061125 0.359355 0.042471 NA
# - attr(*, "heading")= chr "Analysis of Variance Table\n" "Response: sr"
您指的是
R
函数,这是特定于R
的。你最好阅读这些函数的文档&问一个关于基本统计概念的问题。我确实是第一次阅读文档的。恕我直言,这是我能找到的最隐秘的。这是我的最后一条途径。为了理解必要的统计概念(不平衡、I型SS等),在这里阅读我的答案可能会有帮助:在您阅读了@gung链接的建议文章之后,为什么不带一个新问题回到这里,问您不了解哪些统计位?有些东西很棘手。
str(z)
#Classes ‘anova’ and 'data.frame': 5 obs. of 5 variables:
# $ Df : int 1 1 1 1 45
# $ Sum Sq : num 204.1 53.3 12.4 63.1 650.7
# $ Mean Sq: num 204.1 53.3 12.4 63.1 14.5
# $ F value: num 14.116 3.689 0.858 4.36 NA
# $ Pr(>F) : num 0.000492 0.061125 0.359355 0.042471 NA
# - attr(*, "heading")= chr "Analysis of Variance Table\n" "Response: sr"