R中的DNAStringSet错误生物串

R中的DNAStringSet错误生物串,string,r,bioinformatics,fasta,bioconductor,String,R,Bioinformatics,Fasta,Bioconductor,我在Biostars上发布了同样的困惑,但那里的流量似乎很低,所以我想我可能会在这里提出这个问题 我正试图使用Bioconductor的“Biostrings”包和“DNAStringSet”函数将fasta序列文件导入R,但我一直收到相同的错误: Error in .Call2("new_XString_from_CHARACTER", classname, x, start(solved_SEW), : key 112 (char 'p') not in lookup table 我的

我在Biostars上发布了同样的困惑,但那里的流量似乎很低,所以我想我可能会在这里提出这个问题

我正试图使用Bioconductor的“Biostrings”包和“DNAStringSet”函数将fasta序列文件导入R,但我一直收到相同的错误:

Error in .Call2("new_XString_from_CHARACTER", classname, x, start(solved_SEW),  : 
key 112 (char 'p') not in lookup table
我的fasta文件(“FileName.fa”)由不同长度的序列组成,格式如下:

>GeneNameOne
CAGACACCCATAGATACAGATAGACAGATAGAGAAGACACCACCACACAATGA
>GeneNameTwo
CGCGACATGAACCCATGATAGACGATGAGACCCCACACACACC
...etc
我在Unix终端上执行了“grep FileName.fa”,但没有收到任何输出

有人知道发生了什么吗


提前谢谢。

我想好了。我使用了“readDNAStringSet”,如下所示:

FileName <- readDNAStringSet("FileName.fa")

FileName询问有关Bioconductor上Bioconductor软件包的问题(无需订阅)。也许你的文件不是纯文本文件,尽管它有扩展名?这是个好主意,我已经考虑过了。不幸的是,该列表的周转时间有点长,所以我希望有人能够加快我对Stack的查询。谢谢你的回复。FWIW,在发邮件7分钟后,邮件列表上有两个回复(不仅仅是我的!)!好吧,而不是“dnastingset”()。我在最初的帖子中特别提到了这一点。另外,你没有使用你复杂的3页建议,而是通过BioC邮件列表给我发电子邮件。顺便说一下,谢谢你的否决票。这真的给我上了宝贵的一课。