prcomp分组PCA的置信区间
我正在进行RNA序列分析,我对基因表达中哪些基因驱动组织特异性变异感兴趣。PCA在RNA序列分析中很常见,但大多数软件包(如DESeq2)仅将其作为2D图。因此,我使用了prcomp和fviz_pca_ind来生成我的2D图,这样我可以在以后进一步进行分析。但是,由于输入数据结构的原因,我似乎无法将我的分组信息(即组织)包括在我的prcomp对象中,因此无法对我的样本进行颜色编码,也无法在我的分组周围生成置信区间 套餐:prcomp分组PCA的置信区间,r,pca,prcomp,R,Pca,Prcomp,我正在进行RNA序列分析,我对基因表达中哪些基因驱动组织特异性变异感兴趣。PCA在RNA序列分析中很常见,但大多数软件包(如DESeq2)仅将其作为2D图。因此,我使用了prcomp和fviz_pca_ind来生成我的2D图,这样我可以在以后进一步进行分析。但是,由于输入数据结构的原因,我似乎无法将我的分组信息(即组织)包括在我的prcomp对象中,因此无法对我的样本进行颜色编码,也无法在我的分组周围生成置信区间 套餐: library(ggplot2) library(factoextra)
library(ggplot2)
library(factoextra)
library(Deseq2)
我从一个DESeq2对象的方差稳定变换开始(抱歉,这是多长时间…):
即使是子集,数据集也太大了-这里有一个链接(希望这是可以接受的)
以及我的PCA代码(这基本上只是DESeq2中的函数)
产生以下结果:
正如您将在prcomp对象中看到的,没有分组信息。关于如何1)将此信息包含在prcomp对象中,或2)将此信息包含在图形代码中,有什么想法吗?fa您的dput似乎有点大,但这里有一个可复制的示例-只需添加
habillage
和颜色,就可以了
SuppressPackageStatupMessages(不可见)(
Lappy(c(“设计2”,“额外系数”),
require,character.only=TRUE)))
种子集(123)
直接数字合成
####################################################################################################
# Principle component analysis - PRComp
####################################################################################################
# set number of genes to include in PCA
ntop = 500
# calculate the variance for each gene
rv <- rowVars(assay(vst))
# select the ntop genes by variance
select <- order(rv, decreasing=TRUE)[seq_len(min(ntop, length(rv)))]
# perform a PCA on the data in assay(x) for the selected genes
tissue_pca <- prcomp(t(assay(vst)[select,]))
# Visualize samples on PC1 and PC2
fviz_pca_ind(tissue_pca,
# col.var = ,
palette = cbPalette,
ellipse.type = "confidence",
repel = TRUE,
mean = FALSE)