Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/82.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 从ensembl_gene_id获取hgnc_符号/gene_名称_R_Bioinformatics_Bioconductor_Biomart - Fatal编程技术网

R 从ensembl_gene_id获取hgnc_符号/gene_名称

R 从ensembl_gene_id获取hgnc_符号/gene_名称,r,bioinformatics,bioconductor,biomart,R,Bioinformatics,Bioconductor,Biomart,我有以下代码(来自): 如果我将此ID赋予getBM(),它将不返回任何内容 但是,如果我删除该点后的数字,该点如下: "ENSG00000260727", "ENSG00000277521", "ENSG00000116514" 我得到了预期的结果 有没有办法给gene_ID加上分数并得到预期的结果?不是答案,但评论有点太长;如果认为不合适,乐意移除 简而言之,是的,您需要删除Ensembl基因名称的“点位”部分。这些数字表示与稳定的Ensembl标识符相关联的不同版本号 发件人: 当在两种

我有以下代码(来自):

如果我将此ID赋予getBM(),它将不返回任何内容

但是,如果我删除该点后的数字,该点如下:

"ENSG00000260727", "ENSG00000277521", "ENSG00000116514"
我得到了预期的结果


有没有办法给gene_ID加上分数并得到预期的结果?

不是答案,但评论有点太长;如果认为不合适,乐意移除

简而言之,是的,您需要删除Ensembl基因名称的“点位”部分。这些数字表示与稳定的Ensembl标识符相关联的不同版本号

发件人:

当在两种符号之间重新分配稳定标识符时,我们可以选择性地选择增加使用稳定标识符分配的版本号。我们这样做是为了表明实体的潜在变化

对于基因(即形式为
ENSG*
)的Ensembl标识符),当链接到基因的转录本集发生变化时,版本号增加

这篇文章实际上是Biostars上一篇文章的翻版:;您应该看看这里讨论的一些R解决方案


后记 与其使用Biomart,不如使用一些现有的。例如,看看

  • 由约翰内斯·雷纳维护
  • 余光创的功能。它曾经是一个独立的软件包,但被同一作者吸收到了
    clusterProfiler
    ,并提供了“通用生物ID转换器”功能
为什么不在查询之前删除它们?请看和了解如何移除它们。是的,这是我目前所做的。这是在Biostars上提出的一个问题的重复帖子:;我在下面的“回答”/“扩展评论”中给出了一些细节。请看一看。好的,谢谢,事实上我看到了这篇文章,但它是12个月前写的。我问自己,biomart是否会自我更新以捕获这个“错误”(这不是一个真正的错误)。我今天开始使用biomart;我同意你的观点,我可能不会说这是一个错误;我想这可以归结为Biomart如何定义一个
“ensembl\u基因id”
。无论如何,对于不同基因命名系统(Ensembl、Hugo、Entrez、RefSeq等)之间的映射,通常最好使用Bioconductor的
org.*.db
包;Biomart的速度很慢,而且通常不是最新的。
"ENSG00000260727.1", "ENSG00000277521.1", "ENSG00000116514.16"
"ENSG00000260727", "ENSG00000277521", "ENSG00000116514"