Ubuntu 使用wget作为用户代理

Ubuntu 使用wget作为用户代理,ubuntu,wget,http-status-code-403,Ubuntu,Wget,Http Status Code 403,如何使用wget通过命令行下载没有403的文本文件? 我正在设置用户代理,但仍然得到403: 命令 ubuntu@ip-172-31-44-71:~/Downloads$ wget -O jane-austen.txt --user-agent="Mozilla/5.0 (Windows NT 5.2; rv:2.0.1) Gecko/20100101 Firefox/4.0.1" "http://www.gutenberg.org/files/1342/1342-0.txt" 输出 --2

如何使用wget通过命令行下载没有403的文本文件? 我正在设置用户代理,但仍然得到403:

命令

ubuntu@ip-172-31-44-71:~/Downloads$ wget -O jane-austen.txt  --user-agent="Mozilla/5.0 (Windows NT 5.2; rv:2.0.1) Gecko/20100101 Firefox/4.0.1" "http://www.gutenberg.org/files/1342/1342-0.txt"
输出

--2017-02-07 21:10:58--  http://www.gutenberg.org/files/1342/1342-0.txt
Resolving www.gutenberg.org (www.gutenberg.org)... 152.19.134.47, 2610:28:3090:3000:0:bad:cafe:47
Connecting to www.gutenberg.org (www.gutenberg.org)|152.19.134.47|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2017-02-07 21:11:06 ERROR 403: Forbidden.

我认为这与用户代理无关。这只是意味着你无法使用文本。你需要研究一下规则。FWIW,wget在没有任何特殊标题的情况下为我工作。我也是,它与:
wget-O jane-austen.txt一起工作”http://www.gutenberg.org/files/1342/1342-0.txt“
GNU Wget 1.19构建在linux-GNU上。用户代理不会神奇地将403变为200,哈哈。但对于为什么会发生这种情况有一些见解:在我的浏览器中键入相同的URL时,我被重定向到一个“欢迎,陌生人”页面。随后的访问正确地转到了正确的文件。您可能想尝试启用一个会话,或者只是简单地访问浏览器上的文件一次,以确保它们缓存您的IP。@Akshat:有趣的行为,在这种情况下,我们是否需要一个wget做两次?@Tom Kuschel-这取决于Gutenberg的网站及其处理请求的行为。尝试访问文件两次可能不是个坏主意。