Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/xslt/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用biomaRt注释位置_R_Bioinformatics_Bioconductor_Biomart - Fatal编程技术网

使用biomaRt注释位置

使用biomaRt注释位置,r,bioinformatics,bioconductor,biomart,R,Bioinformatics,Bioconductor,Biomart,我有一些基因组位置,我想利用生物分子标记软件包对这些位置进行注释(找到Ensembl基因ID,外显子、内含子等特征) 我的部分数据 chr start stop strand chr10 100572320 100572373 - chr10 100572649 100572658 + 准备好数据以查询biomaRt 样本数据 data = data.frame(chr = "chr17",

我有一些基因组位置,我想利用生物分子标记软件包对这些位置进行注释(找到Ensembl基因ID,外显子、内含子等特征)

我的部分数据

  chr       start        stop     strand
chr10   100572320   100572373          -   
chr10   100572649   100572658          +   

准备好数据以查询biomaRt

样本数据

data = data.frame(chr = "chr17", start = 63973115, end = 64437414)
data$query = paste(gsub("chr",'',data$chr),data$start,data$end, sep = ":")

#> data
#    chr    start      end                query
#1 chr17 63973115 64437414 17:63973115:64437414
然后使用biomaRt

library(biomaRt)

# select your dataset of interest accordingly. 
# I have used human specific dataset identifier
# you can see all available datasets using listDatasets(mart),
# after setting your mart of interest

mart = useMart(
         'ENSEMBL_MART_ENSEMBL', 
          host = 'ensembl.org', 
          dataset = 'hsapiens_gene_ensembl')

# do listAttributes(mart) to list all information you can extract using biomaRt

out = getBM(
        attributes = c('ensembl_gene_id', 'external_gene_name', 'gene_biotype', 
                       'ensembl_transcript_id', 'ensembl_exon_id'), 
        filters = 'chromosomal_region', 
        values = data$query, 
        mart = mart)

这将为您提供给定基因组位置中存在的基因、转录本和外显子的ensembl ID。biomaRt提供了更多信息,因此不要忘记使用
listAttributes()
查找所有信息。

感谢Veerendra的帮助。但我也想知道这些位置位于哪些区域(内含子、外显子或内含子)。我找不到合适的属性。在这方面你能帮我吗?正如我提到的,使用
listtributes()
查找所有可提取的信息。我想你可以得到这个区域内的外星坐标。如果没有,你可以直接从EnsemblFTP站点下载gtf文件并查看它。另一个选择是使用基因组特征库。它允许您使用biomart构建自己的数据库,希望您能从中找到所需的所有信息。我认为您无法找到所有功能位置的直接注释,因此您必须稍微解决一下。为此,我发现
GenomicFeatures
库非常有用。你可以看一下它的说明书。我在mart之后又多了一步