BioPython:如何在GenBank中通过“Locus”键解析

BioPython:如何在GenBank中通过“Locus”键解析,python,pandas,bioinformatics,biopython,genbank,Python,Pandas,Bioinformatics,Biopython,Genbank,我有一个包含许多序列的Genbank文件。我在TSV中有第二个文本文件,其中包含这些序列的名称,以及关于它们的一些其他信息,我将其作为数据帧读入。我使用.sample函数从该数据中随机选择一个名称,并将其分配给变量n_name,如下面的代码块所示 n = df_bp_pos_2.sample(n = 1) n_value = n.iloc[:2] n_name = n.iloc[:1] n_name等于genbank文件中的轨迹名,大小写准确。我试图解析genbank文件并提取具有locus=

我有一个包含许多序列的Genbank文件。我在TSV中有第二个文本文件,其中包含这些序列的名称,以及关于它们的一些其他信息,我将其作为数据帧读入。我使用.sample函数从该数据中随机选择一个名称,并将其分配给变量n_name,如下面的代码块所示

n = df_bp_pos_2.sample(n = 1)
n_value = n.iloc[:2]
n_name = n.iloc[:1]
n_name等于genbank文件中的轨迹名,大小写准确。我试图解析genbank文件并提取具有locus=n_name的序列。genbank文件名为all.gb。我有:


但我不太确定下一行或下一行应该是什么,通过轨迹解析?有什么想法吗

您也可以使用一个轨迹标记列表,而不仅仅是一个轨迹标记

来自Bio import SeqIO 轨迹标记=[b0001,b0002]轨迹标记示例列表 记录=[] 对于SeqIO.parse'all.gb','genbank'中的记录: 对于record.features中的功能: tag=feature.qualifiers.get'locus\u tag' 如果标签: 如果轨迹_标记中的标记[0]: 在这里,如果您只需要特征dna序列,您需要使用提取方法从记录中提取特征序列,或者通过在限定符中加入“翻译”字段来获得蛋白质的翻译,或者动态翻译特征。之后,您可以将结果记录显示到“records”。
有关提取方法和特征限定符的更多信息,请参见。

查阅相关的Biopython教程部分,查找seq_record.features,然后在可能需要查看特征限定符['Local_tag']的地方遍历特征。请注意,轨迹_标记是可选的。该值也是字符串列表。
from Bio import SeqIO
for seq_record in SeqIO.parse("all.gb", "genbank"):