R 如何从fasta文件中获取基因组坐标_R_Fasta_Bioconductor_Genome_Iranges

R 如何从fasta文件中获取基因组坐标

R 如何从fasta文件中获取基因组坐标,r,fasta,bioconductor,genome,iranges,R,Fasta,Bioconductor,Genome,Iranges,由于参考基因组有更新，我不得不从旧序列（从bed文件）中获取fasta，以在上一版本中找到新的坐标因此，从我的名为“my.fasta”的fasta文件（包含35个序列）我创建了一个“dnastingset”对象，如下所示： library ("GenomicRanges") setwd("/pwd") pwd <- "my.fasta" #INPUT FILES- BedFiles, FASTA, etc. path <- system.file("pwd", pack

由于参考基因组有更新，我不得不从旧序列（从bed文件）中获取fasta，以在上一版本中找到新的坐标

因此，从我的名为“my.fasta”的fasta文件（包含35个序列）

我创建了一个“dnastingset”对象，如下所示：

 library ("GenomicRanges")
 setwd("/pwd")
 pwd  <- "my.fasta" #INPUT FILES- BedFiles, FASTA, etc.
 path <- system.file("pwd", package = "rGADEM")
 FastaFile <- paste(pwd, path, sep = "")
 Sequences <- readDNAStringSet(FastaFile, "fasta")
 Sequences

 A DNAStringSet instance of length 35
     width seq                                              names
 [1]   300 TTCAGATTGGAGATGGTGAATGA...AACCCTCTGCATAGAATCATAG
 [2]   300 GTCTCCCTTCGTGGAGGGGTCAC...TTAACTGAAGATGTTTCCCCGT

库（“基因组范围”）
setwd（“/pwd”）
pwd
library("rGADEM")
gadem <- GADEM(Sequences, verbose = 1, genome = Ggallus)

startPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
endPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds