BioPython：如何将氨基酸字母表转换为_Python_Bioinformatics_Biopython

BioPython：如何将氨基酸字母表转换为

python

BioPython：如何将氨基酸字母表转换为,python,bioinformatics,biopython,Python,Bioinformatics,Biopython,当讨论如何使用Bio.SeqIO.parse（）导入序列数据时，BioPython cookbook指出：有一个可选的参数字母表来指定要使用的字母表。这对于像FASTA这样的文件格式很有用，否则Bio.SeqIO将默认为通用字母表如何添加此可选参数？我有以下代码： from os.path import abspath from Bio import SeqIO handle = open(f_path, "rU") records = list(SeqIO.parse(handle, "

当讨论如何使用Bio.SeqIO.parse（）导入序列数据时，BioPython cookbook指出：

有一个可选的参数字母表来指定要使用的字母表。这对于像FASTA这样的文件格式很有用，否则Bio.SeqIO将默认为通用字母表

如何添加此可选参数？我有以下代码：

from os.path import abspath
from Bio import SeqIO

handle = open(f_path, "rU")
records = list(SeqIO.parse(handle, "fasta"))
handle.close()

这将从UniProt数据库导入大量FASTA文件。问题是它在通用的SingleLetterAlphabet类中。如何将SingleLetterAlphabet转换为ExtendedIUPACProtein

最终目标是在这些序列中搜索GxxxG等图案。

如下所示：

# Import required alphabet
from Bio.Alphabet import IUPAC

# Pass imported alphabet as an argument for `SeqIO.parse`:
records = list(SeqIO.parse(handle, 'fasta', IUPAC.extended_protein))