Download 我在哪里下载基因表达数据?

Download 我在哪里下载基因表达数据?,download,bioinformatics,genome,Download,Bioinformatics,Genome,我想下载由微阵列实验产生的基因表达数据。我对这个主题了解不多,但据我所知,行通常对应于基因,列对应于样本。理想情况下,我希望有一个基因表达数据矩阵 我一直在互联网上搜索,虽然似乎有很多地方可以下载这些数据,但当我真的下载数据时,我没有得到基因表达矩阵。有没有人能告诉我是否有一个地方或如何下载基因表达数据的格式,我期待上述 非常感谢您的帮助。如果您查看,例如,在中,其中一种文件格式是“TXT”,并且在一些元数据之后包含您想要的矩阵。原则上,微阵列数据可以表示为一个矩阵,样本作为列,行作为基因。在实

我想下载由微阵列实验产生的基因表达数据。我对这个主题了解不多,但据我所知,行通常对应于基因,列对应于样本。理想情况下,我希望有一个基因表达数据矩阵

我一直在互联网上搜索,虽然似乎有很多地方可以下载这些数据,但当我真的下载数据时,我没有得到基因表达矩阵。有没有人能告诉我是否有一个地方或如何下载基因表达数据的格式,我期待上述


非常感谢您的帮助。

如果您查看,例如,在中,其中一种文件格式是“TXT”,并且在一些元数据之后包含您想要的矩阵。

原则上,微阵列数据可以表示为一个矩阵,样本作为列,行作为基因。在实践中,为实验的原始数据推导出这样一种表示形式要复杂得多。如果您只是得到一个预处理的数据集,那么您几乎不能保证原始数据的处理方式可以与其他实验进行比较,或者基本的原始数据具有足够高的质量

您还需要高质量的元数据来从数据矩阵中获得任何意义。这些样本的生物条件和来源是什么?使用的特定阵列上的探针对应哪些基因?(请注意,9890_at是“probeset id”,是特定序列设计的分子探针的唯一标识符,然后需要映射到基因,同一基因的不同探针不会给出完全相同的响应。)

因此,公共微raray数据库除了提供处理后的数据矩阵外,还提供了许多附加信息。除此之外,我会推荐我认为更好的搜索界面

许多人选择使用微阵列数据的工具是统计编程语言的软件套件

Bioconductor提供API,可从两个存储库下载原始数据和附带的元数据,请参阅和

与大多数bioconductor软件一样,这两个软件包都带有介绍该软件的优秀“小插曲”: 及

这些小插曲还应该为您提供获取原始数据并从原始数据中导出“ESET”(表达式集)的示例。此时,您可以访问bioconductor Eset对象中的基因表达矩阵,并且您有一个对象和API来查询必要的元数据


注意,有不同类型的微阵列。我建议从Affymetrix阵列的数据开始,因为它们可能有最简单的分析API

对于该TXT文件,列(即GSM339455、GSM339456、GSM339457等)是基因还是行样本?我正在查看聚类分析。似乎GSM是样本,行确实对应于基因。你能解释一下命名规则吗?i、 e.为什么使用GSM作为列标题,然后使用998_at或9890_at作为行标识符?GSM编号是样本的登录id(您可以在GEO中找到每个样本的id)。文件中列出的“系列平台id”是GPL7144,如果您使用该id查询GEO,您将获得从行标识符到引用基因的各种其他方式的映射。您知道您是否能够按维度进行查询吗?i、 e.我只对超过20000个基因和1000个样本的数据集感兴趣?您可以在设置搜索限制,其中一个选项是样本数,只需将其设置为1000:1000000。基因数量是没有领域的,但现代微阵列基因表达研究将有超过20k个基因,你可以通过平台限制到具有足够覆盖率的平台。这个问题与编程无关。请在BioStar@gotgenes上查询,谢谢!在这里发布之前,我确实尝试过看看是否还有其他stackexchange频道。但现在我肯定知道了!幸运的是,我现在得到了很好的回复和合适的网站。谢谢alex,这也很有帮助。我非常感谢你的答复。