无法在中保存页面https://archive.org/web/_Https

无法在中保存页面https://archive.org/web/

https

无法在中保存页面https://archive.org/web/,https,Https,我知道这个页面应该是可访问的，并且可以打开索引。我有一些网页存在保存在web存档中的问题。它们中的大多数都有https协议。例如，第页为什么我会收到“Bummer.此url在live web上不可用或无法存档”的响应？如“立即保存页面”块中所述：仅适用于允许爬虫的站点阻止webarchive爬虫，使其无法创建站点的快照。您的意思是什么？robots中不允许使用页面。txtI也无法将页面保存在web存档中。它允许在robots.txt中使用，但不包含文件，这在robots.txt中是不允许的

我知道这个页面应该是可访问的，并且可以打开索引。我有一些网页存在保存在web存档中的问题。它们中的大多数都有https协议。例如，第页

为什么我会收到“Bummer.此url在live web上不可用或无法存档”的响应？

如“立即保存页面”块中所述：

仅适用于允许爬虫的站点

阻止webarchive爬虫，使其无法创建站点的快照。

您的意思是什么？robots中不允许使用页面。txtI也无法将页面保存在web存档中。它允许在robots.txt中使用，但不包含文件，这在robots.txt中是不允许的。请删除robots.txt并尝试在站点上保存没有它的页面。我无法访问asterra.ru的文件，但我是在站点中使用的。它不起作用据我所知，archive.org现在会忽略robots.txt内容。如果是这样，你必须检查你网站上的访问日志，看看archive.org向你的网站发送了什么请求，以及这些请求上发送了什么响应。我投票将这个问题作为离题来结束，因为这与编程无关。