R PCA分析中不同类型的椭圆

R PCA分析中不同类型的椭圆,r,pca,R,Pca,在R中使用coord.ellipse(来自FactoMineRpackage)和ordiellipse(来自veganpackage)的单个因子图时计算的椭圆之间有什么区别 下面是一些可复制的代码: library(FactoMineR) library(vegan) data(decathlon) res.pca = PCA(decathlon[,1:10], scale.unit=TRUE, ncp=5, graph=T) pcarda <- rda(decathlon[,1:10

在R中使用
coord.ellipse
(来自
FactoMineR
package)和
ordiellipse
(来自
vegan
package)的单个因子图时计算的椭圆之间有什么区别

下面是一些可复制的代码:

library(FactoMineR)
library(vegan)
data(decathlon)

res.pca = PCA(decathlon[,1:10], scale.unit=TRUE, ncp=5, graph=T) 
pcarda <- rda(decathlon[,1:10],scale=T)
使用椭圆:

ordiplot(pcarda)
ordiellipse(pcarda,groups = decathlon[,13])
这些椭圆提供了一个完全不同的结果

我想直观地评估变量是否能够真正区分我的组。对于coord.ellipse,椭圆几乎是分离的(接受假设),而对于
ordiellipse
,它们大部分是重叠的(拒绝假设)


coord.ellipse
为分类变量的重心构造置信椭圆(默认阈值为0.95,请参阅其帮助)

ordiellipse
为点或其加权平均值构造标准偏差椭圆(请参阅参数
kind
的帮助)

如果您为它们提供相同的参数(默认情况下它们是不同的),则它们是等效的。例如:

par(mfrow=c(1,2))
ellipse.coord = coord.ellipse(concat,bary=TRUE,conf=0.95)
plot.PCA(res.pca,ellipse=ellipse.coord,cex=0.8,ylim=c(-4,4),xlim=c(-4,4))
ordiplot(pcarda,ylim=c(-2,2),xlim=c(-2,2))
ordiellipse(pcarda,groups = decathlon[,13],conf=0.95,kind="se")
要获得:

它看起来并不完全相同,因为图形的比例略有不同(并且很难调整),但您可以看到它们以完全相同的方式分隔点

那么,如何检验你的假设是我们的一个问题。简单地说,如果你想表示你的组是不相交的,只需用两种不同的颜色绘制个体:它们不是。
若你们想表示你们组的重心(一种平均值)之间的差异,那个么使用95%椭圆(我在这里显示的那个)。从我的观点来看,这也不是很确定,但你看。。。或者你进行测试,但是为了这个,你应该问另外一个问题,可能更多的是交叉验证

好吧,但是这两者有什么区别呢?在我的例子中,我想评估我的组是否能很好地区分变量。。。在这种特殊情况下,两种方法提供了不同的结果。一个是几乎分离的椭圆,另一个是大部分重叠的椭圆。与95%可信区间和标准偏差之间的差异相同。在某些时候,您必须深入了解这些功能的帮助…感谢您的帮助!
par(mfrow=c(1,2))
ellipse.coord = coord.ellipse(concat,bary=TRUE,conf=0.95)
plot.PCA(res.pca,ellipse=ellipse.coord,cex=0.8,ylim=c(-4,4),xlim=c(-4,4))
ordiplot(pcarda,ylim=c(-2,2),xlim=c(-2,2))
ordiellipse(pcarda,groups = decathlon[,13],conf=0.95,kind="se")