String 字符串中位置的字母频率

String 字符串中位置的字母频率,string,r,perl,frequency-distribution,String,R,Perl,Frequency Distribution,我想计算字符串中每个位置4个字母的频率。字母是A,T,G,C TGAGGTAGTAGTTTGTGCTGTTAT TAGTAGTTTGTGCTGTTA TGAGGTAGTAGTTTGTAC TGAGAACTGAATTCCATAGG 期望输出: Pos1 Pos2 Pos3 and so on. A 0 1 T 4 0 C 0 0 G 0 3 到目前为止,我已经使用了一个名为Biostrings的R包,它可以工作,但我想知道perl是否可以做到这一点

我想计算字符串中每个位置4个字母的频率。字母是A,T,G,C

TGAGGTAGTAGTTTGTGCTGTTAT
TAGTAGTTTGTGCTGTTA
TGAGGTAGTAGTTTGTAC
TGAGAACTGAATTCCATAGG
期望输出:

  Pos1  Pos2  Pos3  and so on. 
A 0     1
T 4     0
C 0     0
G 0     3
到目前为止,我已经使用了一个名为Biostrings的R包,它可以工作,但我想知道perl是否可以做到这一点

x = "TGAGGTAGTAGTTTGTGCTGTTAT
TAGTAGTTTGTGCTGTTA
TGAGGTAGTAGTTTGTAC
TGAGAACTGAATTCCATAGG"
解决办法是

library(Biostrings)
consensusMatrix(DNAStringSet(strsplit(x, "\n")[[1]]))

对于数百万个序列来说,这将是最快的。

到目前为止,您尝试了什么?。。。为什么要切换到Perl?Perl不会这样做,但可以用Perl来做。但为什么呢?在过去,这样低质量的问题最多只能得到几张反对票,但这表明了一些不健康的宗教热情。让我们看看这是否是我们想要的社区。OP可能有一个非常合理的解释,为什么Perl是这里的首选语言。让我们保持开放的心态,好吗。