Python 使用登录号从ENA数据库的ftp服务器下载数据

Python 使用登录号从ENA数据库的ftp服务器下载数据,python,r,database,ftp,bioinformatics,Python,R,Database,Ftp,Bioinformatics,我想下载ENA数据库(ENA部分基因组)中给出的一些生物体的完整蛋白质序列,以及我所掌握的信息,即大约2500个登录号 我尝试使用分类法部门和所有工具在ftp服务器中更深入地查找它们。但找不到任何相关信息。逐个下载它们并不是一个理想的解决方案 因此,如果你们知道R或python中有任何包可以帮我做这件事,你们能帮我吗?我认为我的这个旧脚本可能有用 需要注意的一点是,基因组是从NCBI而不是ENA下载的,但我认为这些数据库中有很多是相互同步数据的。所以你还是可以找到你想要的 如果您只想从给定的登录

我想下载ENA数据库(ENA部分基因组)中给出的一些生物体的完整蛋白质序列,以及我所掌握的信息,即大约2500个登录号

我尝试使用分类法部门和所有工具在ftp服务器中更深入地查找它们。但找不到任何相关信息。逐个下载它们并不是一个理想的解决方案


因此,如果你们知道R或python中有任何包可以帮我做这件事,你们能帮我吗?

我认为我的这个旧脚本可能有用

需要注意的一点是,基因组是从NCBI而不是ENA下载的,但我认为这些数据库中有很多是相互同步数据的。所以你还是可以找到你想要的

如果您只想从给定的登录号(~2500)下载这些基因组,那么这可能不起作用(除非您可能在下载之前对返回的
搜索结果进行筛选;
Entrez.efetch


我找到了解决我主观问题的方法:

curl -F accessions=@<input_file_path> http://www.ebi.ac.uk/ena/data/download?
display=<output_format> 
-o<output_file_name>
curl-F访问=@http://www.ebi.ac.uk/ena/data/download?
显示=
-o

请将链接发送到包含您要下载的数据的特定页面。这个站点上的大多数程序员都没有使用过ENA数据库。您还可以提供逐个下载的步骤。毕竟,这些都可能是脚本自动化的步骤。你可以很容易地用ENA支持的RESTAPI实现这一点…,你有没有尝试过任何编码?
curl -F accessions=@<input_file_path> http://www.ebi.ac.uk/ena/data/download?
display=<output_format> 
-o<output_file_name>