Database 创建关系型GWAS/Genomics数据库

Database 创建关系型GWAS/Genomics数据库,database,bioinformatics,genetics,Database,Bioinformatics,Genetics,我想在我尝试从头开始建造东西之前,我应该先问一下 这是我需要回答的问题类型。我们的一位研究人员对我说:“我们的数据中有多少人有这样或那样的SNP基因型?” 我们的遗传学数据由几十个GWAS文件组成,通常以平面分隔。每个GWAS文件都有100000-1000000个SNP。SNPs中有一些重叠,但比我最初想象的要少 无论如何,我想做的是建立一个结构化的数据库,将我们的参与者ID链接到一个特定的GWAS研究,然后将GWAS研究链接到一个SNP列表,我可以编写某种查询,它将提取所有具有数据的ID。在任

我想在我尝试从头开始建造东西之前,我应该先问一下

这是我需要回答的问题类型。我们的一位研究人员对我说:“我们的数据中有多少人有这样或那样的SNP基因型?”

我们的遗传学数据由几十个GWAS文件组成,通常以平面分隔。每个GWAS文件都有100000-1000000个SNP。SNPs中有一些重叠,但比我最初想象的要少

无论如何,我想做的是建立一个结构化的数据库,将我们的参与者ID链接到一个特定的GWAS研究,然后将GWAS研究链接到一个SNP列表,我可以编写某种查询,它将提取所有具有数据的ID。在任何情况下我都不需要个体水平的基因型数据,一旦我知道了SNP/样本的位置,就可以更容易地提取出我需要的SNP/样本

这就是我的问题,也是我在寻找的。对于任何使用大量GWAS数据的人,我相信您都熟悉这个问题。是否有任何东西(免费或付费)是为这种类型的问题建立的?或者你有没有想过如果我需要自己建造它,我会朝着什么方向走

谢谢