如何使用fasta文件而不是biopython中的蛋白质序列创建多序列比对_Python_Bioinformatics_Biopython_Fasta_Sequence Alignment

如何使用fasta文件而不是biopython中的蛋白质序列创建多序列比对

python

如何使用fasta文件而不是biopython中的蛋白质序列创建多序列比对,python,bioinformatics,biopython,fasta,sequence-alignment,Python,Bioinformatics,Biopython,Fasta,Sequence Alignment,我希望能够使用与脚本下载在同一目录中的文件编写多个序列比对。然而，在Biopython的食谱中，显示这一点的唯一方法是写出字符串，而不是加载文件。我希望能够做到后者。以下是如何在中进行多重序列对齐我们的目标是使用它从所有蛋白质序列中生成一个门树。这个例子使用了三个SeqRecord对象，它们是使用提供的DNA字符串创建的SeqIO.parse允许您读取fasta格式的文件，并返回对齐的SeqRecord对象例如：导入操作系统来自Bio import SeqIO 从Bio.Align导入多

我希望能够使用与脚本下载在同一目录中的文件编写多个序列比对。然而，在Biopython的食谱中，显示这一点的唯一方法是写出字符串，而不是加载文件。我希望能够做到后者。以下是如何在中进行多重序列对齐

我们的目标是使用它从所有蛋白质序列中生成一个门树。

这个例子使用了三个SeqRecord对象，它们是使用提供的DNA字符串创建的

SeqIO.parse

允许您读取fasta格式的文件，并返回对齐的SeqRecord对象

例如：

导入操作系统
来自Bio import SeqIO
从Bio.Align导入多重对齐
#文件需要是包含文件名的列表
#使用例如。
#files=[f表示os.listdir（）中的f，如果f中的'fasta'
记录=[]
对于文件中的f：
对于SeqIO.parse（f，format='fasta'）中的记录：
记录。追加（记录）
align1=多重对齐（记录）

或者，如果您已经有序列文件，您可以将这些文件连接成一个序列文件，然后使用独立或在线模式下的工具

from Bio.Seq import Seq
from Bio.SeqRecord import SeqRecord
from Bio.Align import MultipleSeqAlignment

align1 = MultipleSeqAlignment([
             SeqRecord(Seq("ACTGCTAGCTAG", generic_dna), id="Alpha"),
             SeqRecord(Seq("ACT-CTAGCTAG", generic_dna), id="Beta"),
             SeqRecord(Seq("ACTGCTAGDTAG", generic_dna), id="Gamma"),
         ])