从fasta序列生成表格,python

从fasta序列生成表格,python,python,bioinformatics,Python,Bioinformatics,我有大约500个fasta格式的蛋白质序列,我是通过blastp搜索得到的。根据这些序列,我需要有蛋白质名称、生物体、Uniprot ID,如果可能的话还有蛋白质家族,这样我就可以用这些信息构建一个表 有什么方法可以用python来实现吗?与Uniprot通信的一些函数?如何解析fasta头中的信息 您应该看看有FASTA解析器的。解析后,您可以使用DataFrame构建表。如果没有一段示例数据,就很难提供一个更准确的答案,但应该可以使用大约5行代码:) 您应该看看有一个FASTA解析器的。解析

我有大约500个fasta格式的蛋白质序列,我是通过blastp搜索得到的。根据这些序列,我需要有蛋白质名称、生物体、Uniprot ID,如果可能的话还有蛋白质家族,这样我就可以用这些信息构建一个表

有什么方法可以用python来实现吗?与Uniprot通信的一些函数?如何解析fasta头中的信息

您应该看看有FASTA解析器的。解析后,您可以使用
DataFrame
构建表。如果没有一段示例数据,就很难提供一个更准确的答案,但应该可以使用大约5行代码:)

您应该看看有一个FASTA解析器的。解析后,您可以使用
DataFrame
构建表。如果没有一段示例数据,就很难提供一个更准确的答案,但应该可以使用大约5行代码:)

from Bio import SeqIO
with open("example.fasta", "rU") as handle:
    print list(SeqIO.parse(handle, "fasta"))