计算R中两个基因序列之间的差异百分比
我还没有在问题或R包中找到这一点,希望很简单 以两个假设的基因序列为例:计算R中两个基因序列之间的差异百分比,r,dna-sequence,R,Dna Sequence,我还没有在问题或R包中找到这一点,希望很简单 以两个假设的基因序列为例: Sequence A: ATG CGC AAC GTG GAG CAT Sequence B: ATG GGC TAC GTG GAT CAA 我想用R代码生成两个序列之间单个核苷酸的百分比差异(例如15%) 有什么想法吗?提前谢谢。如果我正确理解了您的问题,那么您只需要做一个简单的字符串比较。比如说, R> seq1 = c("A", "T", "G", "C", "G", "C", "
Sequence A: ATG CGC AAC GTG GAG CAT
Sequence B: ATG GGC TAC GTG GAT CAA
我想用R代码生成两个序列之间单个核苷酸的百分比差异(例如15%)
有什么想法吗?提前谢谢。如果我正确理解了您的问题,那么您只需要做一个简单的字符串比较。比如说,
R> seq1 = c("A", "T", "G", "C", "G", "C",
"A", "A", "C", "G", "T", "G",
"G", "A", "G", "C", "A", "T")
R> seq2 = c("A", "T", "G", "G", "G", "C",
"T", "A", "C", "G", "T", "G",
"G", "A", "G", "C", "A", "A")
R> seq1 != seq2
[1] FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE FALSE TRUE
R> sum(seq1 != seq2)/length(seq1)*100
[1] 16.67
要获得上述格式的数据,请查看strsplit函数。如果我正确理解了您的问题,那么您只需进行简单的字符串比较。比如说,
R> seq1 = c("A", "T", "G", "C", "G", "C",
"A", "A", "C", "G", "T", "G",
"G", "A", "G", "C", "A", "T")
R> seq2 = c("A", "T", "G", "G", "G", "C",
"T", "A", "C", "G", "T", "G",
"G", "A", "G", "C", "A", "A")
R> seq1 != seq2
[1] FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE
[13] FALSE FALSE FALSE FALSE FALSE TRUE
R> sum(seq1 != seq2)/length(seq1)*100
[1] 16.67
要以上述格式获取数据,请查看
strsplit
函数。不确定作业是如何标记的..不确定作业是如何标记的。。