prcomp分组PCA的置信区间

prcomp分组PCA的置信区间,r,pca,prcomp,R,Pca,Prcomp,我正在进行RNA序列分析,我对基因表达中哪些基因驱动组织特异性变异感兴趣。PCA在RNA序列分析中很常见,但大多数软件包(如DESeq2)仅将其作为2D图。因此,我使用了prcomp和fviz_pca_ind来生成我的2D图,这样我可以在以后进一步进行分析。但是,由于输入数据结构的原因,我似乎无法将我的分组信息(即组织)包括在我的prcomp对象中,因此无法对我的样本进行颜色编码,也无法在我的分组周围生成置信区间 套餐: library(ggplot2) library(factoextra)

我正在进行RNA序列分析,我对基因表达中哪些基因驱动组织特异性变异感兴趣。PCA在RNA序列分析中很常见,但大多数软件包(如DESeq2)仅将其作为2D图。因此,我使用了prcomp和fviz_pca_ind来生成我的2D图,这样我可以在以后进一步进行分析。但是,由于输入数据结构的原因,我似乎无法将我的分组信息(即组织)包括在我的prcomp对象中,因此无法对我的样本进行颜色编码,也无法在我的分组周围生成置信区间

套餐:

library(ggplot2)
library(factoextra)
library(Deseq2)
我从一个DESeq2对象的方差稳定变换开始(抱歉,这是多长时间…):

即使是子集,数据集也太大了-这里有一个链接(希望这是可以接受的)

以及我的PCA代码(这基本上只是DESeq2中的函数)

产生以下结果:


正如您将在prcomp对象中看到的,没有分组信息。关于如何1)将此信息包含在prcomp对象中,或2)将此信息包含在图形代码中,有什么想法吗?fa

您的dput似乎有点大,但这里有一个可复制的示例-只需添加
habillage
和颜色,就可以了

SuppressPackageStatupMessages(不可见)(
Lappy(c(“设计2”,“额外系数”),
require,character.only=TRUE)))
种子集(123)
直接数字合成
####################################################################################################
# Principle component analysis - PRComp
####################################################################################################

# set number of genes to include in PCA
ntop = 500

# calculate the variance for each gene
rv <- rowVars(assay(vst))

# select the ntop genes by variance
select <- order(rv, decreasing=TRUE)[seq_len(min(ntop, length(rv)))]

# perform a PCA on the data in assay(x) for the selected genes
tissue_pca <- prcomp(t(assay(vst)[select,]))
# Visualize samples on PC1 and PC2
fviz_pca_ind(tissue_pca,
            # col.var = ,
             palette = cbPalette,
             ellipse.type = "confidence",
             repel = TRUE,
             mean = FALSE)