BioPython：如何在GenBank中通过“Locus”键解析_Python_Pandas_Bioinformatics_Biopython_Genbank

BioPython：如何在GenBank中通过“Locus”键解析

python pandas

BioPython：如何在GenBank中通过“Locus”键解析,python,pandas,bioinformatics,biopython,genbank,Python,Pandas,Bioinformatics,Biopython,Genbank,我有一个包含许多序列的Genbank文件。我在TSV中有第二个文本文件，其中包含这些序列的名称，以及关于它们的一些其他信息，我将其作为数据帧读入。我使用.sample函数从该数据中随机选择一个名称，并将其分配给变量n_name，如下面的代码块所示 n = df_bp_pos_2.sample(n = 1) n_value = n.iloc[:2] n_name = n.iloc[:1] n_name等于genbank文件中的轨迹名，大小写准确。我试图解析genbank文件并提取具有locus=

我有一个包含许多序列的Genbank文件。我在TSV中有第二个文本文件，其中包含这些序列的名称，以及关于它们的一些其他信息，我将其作为数据帧读入。我使用.sample函数从该数据中随机选择一个名称，并将其分配给变量n_name，如下面的代码块所示

n = df_bp_pos_2.sample(n = 1)
n_value = n.iloc[:2]
n_name = n.iloc[:1]

n_name等于genbank文件中的轨迹名，大小写准确。我试图解析genbank文件并提取具有locus=n_name的序列。genbank文件名为all.gb。我有：

但我不太确定下一行或下一行应该是什么，通过轨迹解析？有什么想法吗

您也可以使用一个轨迹标记列表，而不仅仅是一个轨迹标记

来自Bio import SeqIO 轨迹标记=[b0001，b0002]轨迹标记示例列表记录=[] 对于SeqIO.parse'all.gb'，'genbank'中的记录：对于record.features中的功能： tag=feature.qualifiers.get'locus\u tag' 如果标签：如果轨迹_标记中的标记[0]：在这里，如果您只需要特征dna序列，您需要使用提取方法从记录中提取特征序列，或者通过在限定符中加入“翻译”字段来获得蛋白质的翻译，或者动态翻译特征。之后，您可以将结果记录显示到“records”。

有关提取方法和特征限定符的更多信息，请参见。

查阅相关的Biopython教程部分，查找seq_record.features，然后在可能需要查看特征限定符['Local_tag']的地方遍历特征。请注意，轨迹_标记是可选的。该值也是字符串列表。

from Bio import SeqIO
for seq_record in SeqIO.parse("all.gb", "genbank"):