Recursion wget无法下载网站(错误0:无说明)

Recursion wget无法下载网站(错误0:无说明),recursion,curl,wget,mirror,Recursion,Curl,Wget,Mirror,我试图在网站上镜像整个网站 通过浏览器(Firefox、w3m)或邮递员进行访问可以正常工作,并返回html文件。 通过wget,cURL访问,Python请求模块和HTTrack全部失败 wget在以下情况下特别失败: ↪ wget --mirror -p --convert-links "http://opposedforces.com/parts/impreza/en_g11/type_63/" --2021-02-03 20:48:29-- http://oppo

我试图在网站上镜像整个网站

通过浏览器(Firefox、w3m)或邮递员进行访问可以正常工作,并返回html文件。 通过
wget
cURL
访问,Python
请求
模块和HTTrack全部失败

wget
在以下情况下特别失败:

↪ wget --mirror -p --convert-links  "http://opposedforces.com/parts/impreza/en_g11/type_63/"
--2021-02-03 20:48:29--  http://opposedforces.com/parts/impreza/en_g11/type_63/
Resolving opposedforces.com (opposedforces.com)... 138.201.30.59Connecting to opposedforces.com (opposedforces.com)|138.201.30.59|:80... connected.
HTTP request sent, awaiting response...  0
2021-02-03 20:48:29 ERROR 0: (no description).

Converted links in 0 files in 0 seconds.
它似乎没有返回任何信息。起初我以为是一些JavaScript在生成html,但我找不到任何使用Firefox开发工具的JS,我假设Postman在这种情况下不起作用


有什么办法可以解决这个问题吗?理想情况下,我可以使用
wget
下载此页面和所有子页面,但也欢迎其他解决方案。

这是网站完全崩溃的时候之一。 不幸的是,web浏览器为了支持这样破碎的网页付出了巨大的努力

问题是服务器发送了一个中断的响应。这是我看到的回应:

---response begin---
HTTP/1.1 000 
Cache-Control: no-cache
Pragma: no-cache
Content-Length: 44892
Expires: -1
Server: Microsoft-IIS/7.5
X-AspNet-Version: 2.0.50727
Set-Cookie: ASP.NET_SessionId=gxhoir45jpd43545iujdpiru; path=/; HttpOnly
X-Powered-By: ASP.NET
Date: Fri, 05 Feb 2021 09:26:26 GMT
看到了吗?它返回HTTP/1.1000响应,这在规范中不存在。Web浏览器似乎只接受它作为200响应,然后继续。Wget没有


但是您可以通过使用
--错误时的内容
选项来解决此问题,该选项要求Wget下载内容,而不考虑响应代码

谢谢!这似乎解决了主要问题,但我仍然无法递归下载。不确定这是否仍然是一个网站的问题,但在线文档表明这应该工作,所以我认为它是<代码>wget--递归--无碰撞--页面要求--转换链接--错误内容--域“oppostedforces.com”--无父级http://opposedforces.com/parts/impreza/en_g11/type_63/“
是的,我认为Wget不会在页面中重复出现。Wget将服务器响应标识为错误条件,因此它不会尝试递归地从该页面获取。除了向网站管理员投诉,你没什么可做的