将TPM数据转换为Seurat的读取计数

将TPM数据转换为Seurat的读取计数,r,seurat,R,Seurat,我想用Seurat对R进行分析,但为此我需要一个带有读取计数的计数矩阵。但是,中提供了我想要使用的数据,这不适合用作输入,因为我想与使用读取计数的其他分析进行比较 有人知道如何将TPM数据转换为读取计数吗? 提前谢谢 您需要总计数和基因(或转录本)长度接近该转换。有关反向操作,请参阅 从该链接: You can create a TPM matrix by dividing each column of the counts matrix by some estimate of the gene

我想用Seurat对R进行分析,但为此我需要一个带有读取计数的计数矩阵。但是,中提供了我想要使用的数据,这不适合用作输入,因为我想与使用读取计数的其他分析进行比较

有人知道如何将TPM数据转换为读取计数吗?


提前谢谢

您需要总计数和基因(或转录本)长度接近该转换。有关反向操作,请参阅

从该链接:

You can create a TPM matrix by dividing each column of the counts matrix by some estimate of the gene length (again this is not ideal for the reasons stated above).

x <- counts.mat / gene.length

Then with this matrix x, you do the following:

tpm.mat <- t( t(x) * 1e6 / colSums(x) )

Such that the columns sum to 1 million.
您可以通过将计数矩阵的每一列除以某个基因长度估计值来创建TPM矩阵(同样,出于上述原因,这并不理想)。

我认为如果您添加一些代码示例,这个问题得到回答的可能性会更大。我有这样的代码(TPM中的一些数据行),我想将其转换为read.counts兼容的格式(显示您认为数据应该是什么样子的示例,或者显示您希望将其与read.counts格式的数据进行比较的示例)什么是TPM?看着包裹,似乎更适合谢谢你的回答!我现在确实使用了TPM数据,它似乎工作正常。