R PCA聚类按重复而不是按研究组
我有这样一个数据集:R PCA聚类按重复而不是按研究组,r,pca,R,Pca,我有这样一个数据集: rep1_group1 rep1_group2 rep1_group3 rep2_group1 rep2_group2 rep2_group3 rep3_group1 rep3_group2 rep3_group3 18.26426 18.50355 17.87981 18.14181 18.12318 18.37539 17.54155 17.62264 17.21371 21.10751 21.886
rep1_group1 rep1_group2 rep1_group3 rep2_group1 rep2_group2 rep2_group3 rep3_group1 rep3_group2 rep3_group3
18.26426 18.50355 17.87981 18.14181 18.12318 18.37539 17.54155 17.62264 17.21371
21.10751 21.88614 21.26385 21.42588 21.42358 21.48596 21.18138 21.64957 21.56978
19.95816 19.93991 19.17141 19.23463 19.49048 19.69481 19.99466 20.27674 19.83937
15.77427 15.28338 15.56018 14.74557 15.12376 14.87215 17.58013 17.51229 17.24869
18.55157 18.75156 18.51595 18.69129 18.45551 18.9907 18.31092 18.28075 18.00218
24.40756 24.3009 24.0354 23.87117 24.03002 24.39447 24.45595 24.40041 24.03842
20.6223 20.62194 21.19045 20.85316 20.24748 20.99583 21.70248 20.83252 21.417
18.53522 18.20705 17.84586 18.45471 18.03112 18.24859 17.71512 17.46969 17.20132
17.87237 17.80663 15.99771 16.63991 17.51884 17.11533 18.12308 17.90783 18.29576
因此,简单地描述一下,行包含测量值,列包含3个研究组,每个研究组有3个重复(rep1,rep2,rep3)
当我通常对数据应用变换以获得pca时:
library(ape)
library(data.table)
library(vegan)
tran <- t(data)
tran.pr.b <- vegdist(tran, "bray")
tran.pcoa.b <- pcoa(tran.pr.b)
plot(tran.pcoa.b$vectors[,1:2],main="pcoa, method=bray")
库(ape)
库(数据表)
图书馆(素食主义者)
tran在我看来,你处理问题的方式是错误的:你存储数据的方式将使进行任何类型的分析变得非常困难。阅读Hadley Wickham整洁的数据文件(有一个相关的打包文件,tidyr
,以及旧的但仍然非常有用的Reforme2
),我确实这样做了,在我看来,数据矩阵是按它应该的方式准备的。按照我的逻辑,主成分分析应该推动来自同一研究组的每个复制体彼此靠近。但事实恰恰相反。如果这个矩阵是错误的,我不知道数据应该如何格式化,所以我在这里寻求帮助。在我看来,您处理问题的方式是错误的:您存储数据的方式将使进行任何类型的分析变得非常困难。阅读Hadley Wickham整洁的数据文件(有一个相关的打包文件,tidyr
,以及旧的但仍然非常有用的Reforme2
),我确实这样做了,在我看来,数据矩阵是按它应该的方式准备的。按照我的逻辑,主成分分析应该推动来自同一研究组的每个复制体彼此靠近。但事实恰恰相反。如果这个矩阵是错误的,我不知道数据应该如何格式化,所以我在这里寻求帮助