Google apps script Importhtml()&;Importxml();无法获取URL";-仅在特定网页上

Google apps script Importhtml()&;Importxml();无法获取URL";-仅在特定网页上,google-apps-script,google-sheets,Google Apps Script,Google Sheets,我已经创建了一个谷歌电子表格,它定期从某个数据库中检索数据,并且在大约一个月的时间里运行良好。然而,在前天(2008年8月19日)之后,它突然给出importxml()和importhtml()的“无法获取URL”错误,即使网站本身在使用浏览器时仍然没有问题地加载。与此同时,电子表格上没有任何改变,只是分发给了其他人 (当然,您可以自由复制它;它涉及单元格H1和A2) 我尝试过的解决方案: -谷歌脚本的Urlfetchapp();它似乎能够获取没有问题的网页(但没有importhtml内置的易

我已经创建了一个谷歌电子表格,它定期从某个数据库中检索数据,并且在大约一个月的时间里运行良好。然而,在前天(2008年8月19日)之后,它突然给出importxml()和importhtml()的“无法获取URL”错误,即使网站本身在使用浏览器时仍然没有问题地加载。与此同时,电子表格上没有任何改变,只是分发给了其他人

(当然,您可以自由复制它;它涉及单元格H1和A2)

我尝试过的解决方案:
-谷歌脚本的Urlfetchapp();它似乎能够获取没有问题的网页(但没有importhtml内置的易于格式化)
-在importhtml中包含trim(),以删除url中的任何潜在空格
-尝试了sfstat.info的多个其他子域(如sfstat.info/na/pantheons/);sfstat.info的所有网页似乎都给出了相同的错误
-试图获取其他URL,如Google等。获取这些URL时不会出现问题
-Excel是importhtml的等价物。这似乎也没有问题
-虽然从技术上讲,电子表格会将&minute(now())添加到url,但删除它也不能解决“无法获取url”的问题
-在Google drive上下载并托管该网页,并尝试使用importhtml和importxml获取其数据;这也没有造成问题。因此,由于请求众多,提取可能被视为DoS尝试


先谢谢你

确实不是电子表格导致了这个问题;显然,Google向域sfstat.info发送了大量请求(6小时内超过10k),因此IP被阻止。

“对sfstat.info的请求(6小时内超过10k),因此导致Cloudflare阻止IP。”


它收到了什么错误消息?默认情况下,我们不会阻止谷歌的IP(它们在我们的宏列表中)。

根据网站开发人员的说法,对所有谷歌IP的响应都出现了403错误。此外,当我是唯一一个使用电子表格的人时,没有任何问题,所有数据都按其应有的方式检索。当脚本的多个副本也在获取数据时,出现403错误。也许是我误解了他的反应。他只提到“Cloudflare以403错误响应了所有Google IP,因为该网站在6小时内收到了10000个请求”。您可能需要打开一张支持票,并提供一些详细信息。我想到的唯一一件事是,您可能在防火墙设置中阻止了一个特定的国家,这将创建一个403/challenge页面。默认情况下,我们不会阻止谷歌和其他搜索引擎。不幸的是,这不是我自己的网站;我正在尝试从其他人的数据库中检索数据。关于403错误,可能是网站所有者手动阻止了IP范围(我已经相应地更新了答案)。然而,幸运的是,这个问题已经与网站开发人员解决了,我对上面链接的电子表格的最初意图可能包含在网站本身中(使电子表格变得不必要)。谢谢你提供的信息,但Damon,我非常感谢:)