Wget从XML站点地图下载所有页面

Wget从XML站点地图下载所有页面,xml,wget,Xml,Wget,我认为这个问题相对来说比较容易找到解决方案,但由于某些原因,我尝试过的答案不起作用 我试图简单地使用wget,并使用以下命令下载/镜像我的XML站点地图上的所有链接: wget——安静http://mytestdomain.com/sitemap-pt-sale-2015-02.xml --输出文档-| egrep-o“http://mytestdomain\.com[^问题是您正在使用 -- spider 模式 从手册页: --蜘蛛 当使用此选项调用时,Wget将表现为Web爬行器,这意味

我认为这个问题相对来说比较容易找到解决方案,但由于某些原因,我尝试过的答案不起作用

我试图简单地使用wget,并使用以下命令下载/镜像我的XML站点地图上的所有链接:


wget——安静http://mytestdomain.com/sitemap-pt-sale-2015-02.xml --输出文档-| egrep-o“http://mytestdomain\.com[^问题是您正在使用

-- spider 
模式

从手册页:

--蜘蛛

当使用此选项调用时,Wget将表现为Web爬行器,这意味着它不会下载页面,只需检查页面是否存在

如果要保证下载的文件具有.html扩展名,请使用-E

wget -E -i - --wait 0