R PCA分析中不同类型的椭圆_R_Pca

R PCA分析中不同类型的椭圆

R PCA分析中不同类型的椭圆,r,pca,R,Pca,在R中使用coord.ellipse（来自FactoMineRpackage）和ordiellipse（来自veganpackage）的单个因子图时计算的椭圆之间有什么区别下面是一些可复制的代码： library(FactoMineR) library(vegan) data(decathlon) res.pca = PCA(decathlon[,1:10], scale.unit=TRUE, ncp=5, graph=T) pcarda <- rda(decathlon[,1:10

在R中使用

coord.ellipse

（来自

FactoMineR

package）和

ordiellipse

（来自

vegan

package）的单个因子图时计算的椭圆之间有什么区别

下面是一些可复制的代码：

library(FactoMineR)
library(vegan)
data(decathlon)

res.pca = PCA(decathlon[,1:10], scale.unit=TRUE, ncp=5, graph=T) 
pcarda <- rda(decathlon[,1:10],scale=T)

使用椭圆：

ordiplot(pcarda)
ordiellipse(pcarda,groups = decathlon[,13])

这些椭圆提供了一个完全不同的结果

我想直观地评估变量是否能够真正区分我的组。对于coord.ellipse，椭圆几乎是分离的（接受假设），而对于

ordiellipse

，它们大部分是重叠的（拒绝假设）

coord.ellipse

为分类变量的重心构造置信椭圆（默认阈值为0.95，请参阅其帮助）

ordiellipse

为点或其加权平均值构造标准偏差椭圆（请参阅参数

kind

的帮助）

如果您为它们提供相同的参数（默认情况下它们是不同的），则它们是等效的。例如：

par(mfrow=c(1,2))
ellipse.coord = coord.ellipse(concat,bary=TRUE,conf=0.95)
plot.PCA(res.pca,ellipse=ellipse.coord,cex=0.8,ylim=c(-4,4),xlim=c(-4,4))
ordiplot(pcarda,ylim=c(-2,2),xlim=c(-2,2))
ordiellipse(pcarda,groups = decathlon[,13],conf=0.95,kind="se")

要获得：

它看起来并不完全相同，因为图形的比例略有不同（并且很难调整），但您可以看到它们以完全相同的方式分隔点

那么，如何检验你的假设是我们的一个问题。简单地说，如果你想表示你的组是不相交的，只需用两种不同的颜色绘制个体：它们不是。

若你们想表示你们组的重心（一种平均值）之间的差异，那个么使用95%椭圆（我在这里显示的那个）。从我的观点来看，这也不是很确定，但你看。。。或者你进行测试，但是为了这个，你应该问另外一个问题，可能更多的是交叉验证

好吧，但是这两者有什么区别呢？在我的例子中，我想评估我的组是否能很好地区分变量。。。在这种特殊情况下，两种方法提供了不同的结果。一个是几乎分离的椭圆，另一个是大部分重叠的椭圆。与95%可信区间和标准偏差之间的差异相同。在某些时候，您必须深入了解这些功能的帮助…感谢您的帮助！

par(mfrow=c(1,2))
ellipse.coord = coord.ellipse(concat,bary=TRUE,conf=0.95)
plot.PCA(res.pca,ellipse=ellipse.coord,cex=0.8,ylim=c(-4,4),xlim=c(-4,4))
ordiplot(pcarda,ylim=c(-2,2),xlim=c(-2,2))
ordiellipse(pcarda,groups = decathlon[,13],conf=0.95,kind="se")