Linux wget存在问题,即使使用-A.PDF也不下载PDF
对这个很陌生。。。提前为错误/愚蠢道歉 试图在mac上使用wget从列表下载PDF。我有一个DOI的文本文件(例如10.1046/j.1365-294X.2001.01258.x),基本上我想将这些DOI输入sci-hub.io并下载相应的PDF。我已将DOI添加为合法网址(例如)。当手动输入到chrome中时,这些都可以工作,但不能使用wget来自动执行该过程 尝试: wget-i file.txt wget-A.pdf-i file.txt wget-A.pdf-erobots=off-i file.txt 所有这些仍然返回包含html信息的文件Linux wget存在问题,即使使用-A.PDF也不下载PDF,linux,macos,unix,Linux,Macos,Unix,对这个很陌生。。。提前为错误/愚蠢道歉 试图在mac上使用wget从列表下载PDF。我有一个DOI的文本文件(例如10.1046/j.1365-294X.2001.01258.x),基本上我想将这些DOI输入sci-hub.io并下载相应的PDF。我已将DOI添加为合法网址(例如)。当手动输入到chrome中时,这些都可以工作,但不能使用wget来自动执行该过程 尝试: wget-i file.txt wget-A.pdf-i file.txt wget-A.pdf-erobots=off-i
非常感谢您的任何建议。可能不是您做错了什么,而是网站本身可以禁止“坏”用户代理来防止网页抓取。我只是看了一下您给出的示例页面-它是一个HTML页面,pdf文件嵌入了
标记中。请看源代码。谢谢Pumbo!感谢您的时间和评论!这可能不是你做错了什么,而是网站本身,它可以禁止“坏”用户代理来防止网页抓取。我只是看了一下你给出的示例页面-它是一个HTML页面,pdf文件嵌入在
标记中。请看源代码。谢谢Pumbo!感谢您的时间和评论!