Linux Wget:如何保持会话Cookie处于活动状态以进行递归或镜像下载(--保持会话Cookie不工作)
我正在尝试使用wget下载一个网站,但在第一个网页被克隆后,它不会保持它的会话活动,该网站有一个登录名并使用HTTPS,因此如果没有凭据,我将无法通过它导航。我设法使用cURL登录到服务器,并将其PHPSESSIONID保存到cookie.txt中,因此我正在执行以下过程: 首先,我创建一个cookie.txtLinux Wget:如何保持会话Cookie处于活动状态以进行递归或镜像下载(--保持会话Cookie不工作),linux,curl,cookies,https,wget,Linux,Curl,Cookies,Https,Wget,我正在尝试使用wget下载一个网站,但在第一个网页被克隆后,它不会保持它的会话活动,该网站有一个登录名并使用HTTPS,因此如果没有凭据,我将无法通过它导航。我设法使用cURL登录到服务器,并将其PHPSESSIONID保存到cookie.txt中,因此我正在执行以下过程: 首先,我创建一个cookie.txt wget --save-cookies=cookie.txt --keep-session-cookies "https://huellas.dashboardti
wget --save-cookies=cookie.txt
--keep-session-cookies "https://huellas.dashboardtimes.com/login.php?user=MyUserName&password=MyPass"
--delete-after
没有——因为网站使用GET方法进行身份验证(此方法已成功登录,但仅针对第一页),所以发布数据是给定的
然后:
wget --load-cookies=cookie.txt -m https://Website.wget.com/home
此时,wget clone在成功登录后返回代码200 OK,但当它完成/home并进入另一个模块(例如)时,它会释放其会话,并作为错误克隆所有其他模块-404,返回代码302。我还尝试给命令一个包含几个URL的列表
wget --load-cookies=cookie.txt -m -i list.txt
但我还是得到了同样的结果。-m
选项中是否有可能导致此问题?
因为如果我没有指定-m
选项,它会下载列表中URL的HTML文件,没有错误404,但我需要的不仅仅是HTML,这就是为什么我要使用-m
选项
这有解决办法吗?还是我遗漏了什么
(如果有任何其他工具,如wget,我可以用于此,我也想知道)
谢谢你的回答