用Python'覆盖现有文件;s";wget";?
我已经在我的Python上安装了wget,并且正在使用它从不同的URL下载文件。到目前为止,我的代码如下所示:用Python'覆盖现有文件;s";wget";?,python,wget,Python,Wget,我已经在我的Python上安装了wget,并且正在使用它从不同的URL下载文件。到目前为止,我的代码如下所示: import wget urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip', 'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip', 'https://www.
import wget
urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']
path = '/home/david/data/files/zip_files'
for url in urls:
wget.download(url, path)
我希望我的代码覆盖下载的文件(如果存在),这样每次运行代码时,我都会得到该文件的最新版本,而不是保留旧文件并用不同的名称下载新文件(例如,如果表位_full_v3.zip已经存在,当我执行代码时,它会再次下载,但会保留旧代码,并将新代码重命名为表位_full_v3_1.zip)
我知道wget可以在shell中使用-O参数来实现这一点,但我还没有在文档中看到python版本的-O参数。我感谢您的帮助。尽管
wget
没有提到这一点,但您可以自己更改它。使用os.path.basename()
获取文件名,并检查它是否存在。如下所示:
import wget
import os
urls = ['https://www.iedb.org/downloader.php?file_name=doc/epitope_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/tcell_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/bcell_full_v3.zip',
'https://www.iedb.org/downloader.php?file_name=doc/mhc_ligand_full_single_file.zip']
path = '/home/david/data/files/zip_files'
for url in urls:
filename = path + '/' + os.path.basename(url) # get the full path of the file
if os.path.exists(filename):
os.remove(filename) # if exist, remove it directly
wget.download(url, out=filename) # download it to the specific path.
谢谢你的帮助!我已经给出了一点答案,因为它没有将文件保存到我想要的文件夹中。谢谢你的帮助,非常感谢!:D@DavidMasnouSánchez当我在PC上测试它时,我忘记了更改它。你也可以直接在
路径变量中添加/
。如果wget
would在download()
功能中提供此功能-现在如果由于某种原因下载失败,您将无法获得文件的旧版本或新版本。