String a子串中B串的最佳对齐——生物信息学

String a子串中B串的最佳对齐——生物信息学,string,alignment,sequence,bioinformatics,String,Alignment,Sequence,Bioinformatics,我有两个字符串A和B A = AATCGGATATAG B = CGATA 有些人可能知道两种类型的路线: 但是我想实现一个对齐,它采用A的最佳整个子字符串,如果与B对齐,则产生最佳对齐 例如: A,B -- Alignment algorithm --> AATCGGATATAG CG-ATA 到目前为止,我一直在使用 有人知道解决这个问题的建议吗 提前谢谢 史密斯·沃特曼仍然是你应该使用的算法。为了使整个

我有两个字符串A和B

A = AATCGGATATAG
B = CGATA
有些人可能知道两种类型的路线:

但是我想实现一个对齐,它采用A的最佳整个子字符串,如果与B对齐,则产生最佳对齐

例如:

A,B -- Alignment algorithm --> AATCGGATATAG 
                                  CG-ATA
到目前为止,我一直在使用

有人知道解决这个问题的建议吗


提前谢谢

史密斯·沃特曼仍然是你应该使用的算法。为了使整个序列对齐,您应该将间隙惩罚更改为0。这将使S-W更喜欢间隙而不是不匹配,并根据需要添加尽可能多的间隙以包括整个序列

例如,使用标准核苷酸4.4替代矩阵将间隙惩罚设置为0将使该对齐:

A =  AATCGGATATAG
B =     C-GATA

我有点不明白你所说的“a的整个子串”是什么意思。您想使用全部还是只使用其中最好的部分?在A中有间隙可以吗?在我选择的(最好的)A的子字符串中不应该有间隙