R 如何从fasta文件中获取基因组坐标
由于参考基因组有更新,我不得不从旧序列(从bed文件)中获取fasta,以在上一版本中找到新的坐标 因此,从我的名为“my.fasta”的fasta文件(包含35个序列) 我创建了一个“dnastingset”对象,如下所示:R 如何从fasta文件中获取基因组坐标,r,fasta,bioconductor,genome,iranges,R,Fasta,Bioconductor,Genome,Iranges,由于参考基因组有更新,我不得不从旧序列(从bed文件)中获取fasta,以在上一版本中找到新的坐标 因此,从我的名为“my.fasta”的fasta文件(包含35个序列) 我创建了一个“dnastingset”对象,如下所示: library ("GenomicRanges") setwd("/pwd") pwd <- "my.fasta" #INPUT FILES- BedFiles, FASTA, etc. path <- system.file("pwd", pack
library ("GenomicRanges")
setwd("/pwd")
pwd <- "my.fasta" #INPUT FILES- BedFiles, FASTA, etc.
path <- system.file("pwd", package = "rGADEM")
FastaFile <- paste(pwd, path, sep = "")
Sequences <- readDNAStringSet(FastaFile, "fasta")
Sequences
A DNAStringSet instance of length 35
width seq names
[1] 300 TTCAGATTGGAGATGGTGAATGA...AACCCTCTGCATAGAATCATAG
[2] 300 GTCTCCCTTCGTGGAGGGGTCAC...TTAACTGAAGATGTTTCCCCGT
库(“基因组范围”)
setwd(“/pwd”)
pwd
library("rGADEM")
gadem <- GADEM(Sequences, verbose = 1, genome = Ggallus)
startPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds
endPos(gadem)
Error in x@motifList[[i]] : subscript out of bounds