Bioinformatics SNP ID转换

Bioinformatics SNP ID转换,bioinformatics,Bioinformatics,有人知道一种将单核苷酸多态性SNP ID从rs转换为SNP_a-的方法吗?我有两个SNP,rs429358和rs4420638,需要确定这些SNP是否包含在不同的数据集中。数据集使用SNP_A-xxxxx符号作为SNP ID。任何帮助都将不胜感激 您应该询问biostar: SNP_A不是官方术语。它来自哪里 比较ID的唯一方法是比较染色体/位置/等位基因ref/等位基因alt。SNP\u A标识符很可能是Affymetrix SNP ID。你需要知道它们来自哪个阵列,但可能是人类基因组范围的S

有人知道一种将单核苷酸多态性SNP ID从rs转换为SNP_a-的方法吗?我有两个SNP,rs429358和rs4420638,需要确定这些SNP是否包含在不同的数据集中。数据集使用SNP_A-xxxxx符号作为SNP ID。任何帮助都将不胜感激

您应该询问biostar:

SNP_A不是官方术语。它来自哪里


比较ID的唯一方法是比较染色体/位置/等位基因ref/等位基因alt。

SNP\u A标识符很可能是Affymetrix SNP ID。你需要知道它们来自哪个阵列,但可能是人类基因组范围的SNP6.0

您可以从Affymetrix网站下载注释数据,该网站将提供rs到affyid的映射。尝试从以下位置开始:

选择Genomewide SNP 6.0阵列产品的软件和数据下的注释文件


一个问题是阵列上的一些ProbeSet是冗余的-对于一个小子集,您将有多个affyid映射到一个rsid

,SNP_a*标识符是Affymetrix SNP ID。我也必须做类似的事情,但规模要大得多。。。。从这里使用Affymetrix注释文件Genomewide SNP 6.0并不像我希望的那样映射:

我用的是Biopython,我用的是Python3。首先,您必须通过pip进行安装

完成此操作后,可以使用Entrez库使用esearch方法。以下是一些示例代码:

来自Bio import Entrez Entrez.email= handle=Entrez.esearchdb='snp',retmax='1',sort='snp\u ID',term= 结果=Entrez.readhandle rsNumber='rs'+结果['IdList'][0] 这将从affymetrix id中为您提供正确的rs编号