R PCA聚类按重复而不是按研究组

R PCA聚类按重复而不是按研究组,r,pca,R,Pca,我有这样一个数据集: rep1_group1 rep1_group2 rep1_group3 rep2_group1 rep2_group2 rep2_group3 rep3_group1 rep3_group2 rep3_group3 18.26426 18.50355 17.87981 18.14181 18.12318 18.37539 17.54155 17.62264 17.21371 21.10751 21.886

我有这样一个数据集:

rep1_group1 rep1_group2 rep1_group3 rep2_group1 rep2_group2 rep2_group3 rep3_group1 rep3_group2 rep3_group3
    18.26426    18.50355    17.87981    18.14181    18.12318    18.37539    17.54155    17.62264    17.21371
    21.10751    21.88614    21.26385    21.42588    21.42358    21.48596    21.18138    21.64957    21.56978
    19.95816    19.93991    19.17141    19.23463    19.49048    19.69481    19.99466    20.27674    19.83937
    15.77427    15.28338    15.56018    14.74557    15.12376    14.87215    17.58013    17.51229    17.24869
    18.55157    18.75156    18.51595    18.69129    18.45551    18.9907 18.31092    18.28075    18.00218
    24.40756    24.3009 24.0354 23.87117    24.03002    24.39447    24.45595    24.40041    24.03842
    20.6223 20.62194    21.19045    20.85316    20.24748    20.99583    21.70248    20.83252    21.417
    18.53522    18.20705    17.84586    18.45471    18.03112    18.24859    17.71512    17.46969    17.20132
    17.87237    17.80663    15.99771    16.63991    17.51884    17.11533    18.12308    17.90783    18.29576
因此,简单地描述一下,行包含测量值,列包含3个研究组,每个研究组有3个重复(rep1,rep2,rep3)

当我通常对数据应用变换以获得pca时:

library(ape)
library(data.table)
library(vegan)
tran <- t(data)
tran.pr.b <- vegdist(tran, "bray")
tran.pcoa.b <- pcoa(tran.pr.b)
plot(tran.pcoa.b$vectors[,1:2],main="pcoa, method=bray")
库(ape)
库(数据表)
图书馆(素食主义者)

tran在我看来,你处理问题的方式是错误的:你存储数据的方式将使进行任何类型的分析变得非常困难。阅读Hadley Wickham整洁的数据文件(有一个相关的打包文件,
tidyr
,以及旧的但仍然非常有用的
Reforme2
),我确实这样做了,在我看来,数据矩阵是按它应该的方式准备的。按照我的逻辑,主成分分析应该推动来自同一研究组的每个复制体彼此靠近。但事实恰恰相反。如果这个矩阵是错误的,我不知道数据应该如何格式化,所以我在这里寻求帮助。在我看来,您处理问题的方式是错误的:您存储数据的方式将使进行任何类型的分析变得非常困难。阅读Hadley Wickham整洁的数据文件(有一个相关的打包文件,
tidyr
,以及旧的但仍然非常有用的
Reforme2
),我确实这样做了,在我看来,数据矩阵是按它应该的方式准备的。按照我的逻辑,主成分分析应该推动来自同一研究组的每个复制体彼此靠近。但事实恰恰相反。如果这个矩阵是错误的,我不知道数据应该如何格式化,所以我在这里寻求帮助