无法在中保存页面https://archive.org/web/

无法在中保存页面https://archive.org/web/,https,Https,我知道这个页面应该是可访问的,并且可以打开索引。我有一些网页存在保存在web存档中的问题。它们中的大多数都有https协议。例如,第页 为什么我会收到“Bummer.此url在live web上不可用或无法存档”的响应?如“立即保存页面”块中所述: 仅适用于允许爬虫的站点 阻止webarchive爬虫,使其无法创建站点的快照。您的意思是什么?robots中不允许使用页面。txtI也无法将页面保存在web存档中。它允许在robots.txt中使用,但不包含文件,这在robots.txt中是不允许的

我知道这个页面应该是可访问的,并且可以打开索引。我有一些网页存在保存在web存档中的问题。它们中的大多数都有https协议。例如,第页

为什么我会收到“Bummer.此url在live web上不可用或无法存档”的响应?

如“立即保存页面”块中所述:

仅适用于允许爬虫的站点


阻止webarchive爬虫,使其无法创建站点的快照。

您的意思是什么?robots中不允许使用页面。txtI也无法将页面保存在web存档中。它允许在robots.txt中使用,但不包含文件,这在robots.txt中是不允许的。请删除robots.txt并尝试在站点上保存没有它的页面。我无法访问asterra.ru的文件,但我是在站点中使用的。它不起作用据我所知,archive.org现在会忽略robots.txt内容。如果是这样,你必须检查你网站上的访问日志,看看archive.org向你的网站发送了什么请求,以及这些请求上发送了什么响应。我投票将这个问题作为离题来结束,因为这与编程无关。