prcomp分组PCA的置信区间_R_Pca_Prcomp

prcomp分组PCA的置信区间

prcomp分组PCA的置信区间,r,pca,prcomp,R,Pca,Prcomp,我正在进行RNA序列分析，我对基因表达中哪些基因驱动组织特异性变异感兴趣。PCA在RNA序列分析中很常见，但大多数软件包（如DESeq2）仅将其作为2D图。因此，我使用了prcomp和fviz_pca_ind来生成我的2D图，这样我可以在以后进一步进行分析。但是，由于输入数据结构的原因，我似乎无法将我的分组信息（即组织）包括在我的prcomp对象中，因此无法对我的样本进行颜色编码，也无法在我的分组周围生成置信区间套餐： library(ggplot2) library(factoextra)

我正在进行RNA序列分析，我对基因表达中哪些基因驱动组织特异性变异感兴趣。PCA在RNA序列分析中很常见，但大多数软件包（如DESeq2）仅将其作为2D图。因此，我使用了prcomp和fviz_pca_ind来生成我的2D图，这样我可以在以后进一步进行分析。但是，由于输入数据结构的原因，我似乎无法将我的分组信息（即组织）包括在我的prcomp对象中，因此无法对我的样本进行颜色编码，也无法在我的分组周围生成置信区间

套餐：

library(ggplot2)
library(factoextra)
library(Deseq2)

我从一个DESeq2对象的方差稳定变换开始（抱歉，这是多长时间…）：

即使是子集，数据集也太大了-这里有一个链接（希望这是可以接受的）

以及我的PCA代码（这基本上只是DESeq2中的函数）

产生以下结果：

正如您将在prcomp对象中看到的，没有分组信息。关于如何1）将此信息包含在prcomp对象中，或2）将此信息包含在图形代码中，有什么想法吗？fa

您的dput似乎有点大，但这里有一个可复制的示例-只需添加

habillage

和颜色，就可以了

SuppressPackageStatupMessages（不可见）(
Lappy（c（“设计2”，“额外系数”），
require，character.only=TRUE）））
种子集（123）
直接数字合成
####################################################################################################
# Principle component analysis - PRComp
####################################################################################################

# set number of genes to include in PCA
ntop = 500

# calculate the variance for each gene
rv <- rowVars(assay(vst))

# select the ntop genes by variance
select <- order(rv, decreasing=TRUE)[seq_len(min(ntop, length(rv)))]

# perform a PCA on the data in assay(x) for the selected genes
tissue_pca <- prcomp(t(assay(vst)[select,]))

# Visualize samples on PC1 and PC2
fviz_pca_ind(tissue_pca,
            # col.var = ,
             palette = cbPalette,
             ellipse.type = "confidence",
             repel = TRUE,
             mean = FALSE)