Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/75.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Html 如何获取任何URL或网页的Google缓存年龄?_Html_Url_Hyperlink_Web Scraping - Fatal编程技术网

Html 如何获取任何URL或网页的Google缓存年龄?

Html 如何获取任何URL或网页的Google缓存年龄?,html,url,hyperlink,web-scraping,Html,Url,Hyperlink,Web Scraping,在我的项目中,我需要添加谷歌缓存年龄作为重要信息。我试图搜索谷歌缓存时代的来源,也就是说,谷歌最近一次重新索引所列页面的天数 在哪里可以获得Google缓存年龄?您需要刮取结果页面,但您可以使用以下方法查看最新的缓存页面: 谷歌信息放在body标签的第一个div中。使用URL https://webcache.googleusercontent.com/search?q=cache:<your url without "http://"> https://webcache.goog

在我的项目中,我需要添加谷歌缓存年龄作为重要信息。我试图搜索谷歌缓存时代的来源,也就是说,谷歌最近一次重新索引所列页面的天数


在哪里可以获得Google缓存年龄?

您需要刮取结果页面,但您可以使用以下方法查看最新的缓存页面:

谷歌信息放在body标签的第一个div中。

使用URL

https://webcache.googleusercontent.com/search?q=cache:<your url without "http://">
https://webcache.googleusercontent.com/search?q=cache:
例如:

它包含如下标题:

这是谷歌的缓存。这是2012年8月21日格林威治标准时间11:33:38出现的页面快照。在此期间,当前页面可能已更改。了解更多信息
提示:要在此页面上快速查找您的搜索词,请按Ctrl+F⌘+F(Mac)并使用查找栏

你可以使用这个网站

缓存页面通常由具有强大web服务器的大公司保存和存储。由于此类服务器通常速度非常快,因此缓存页面的访问速度通常比实时页面本身快:

  • 谷歌通常保留该页面的最新副本(1至15天)
  • Coral还保存了一份最新的副本,尽管它通常不如谷歌的版本更新
  • 通过Archive.org,您可以访问多年来保存的网页的多个副本

这一页也很适合查看缓存页面

  • 通过google:webcache.googleusercontent.com/search?q=Cache缓存页面视图:您的url

  • 通过archive.org缓存页面视图:web.archive.org/web/*/您的url


  • 这太简单了,您可以在页面的URL之前键入“cache:”。例如 如果要检查此页面的最后一次网络缓存,只需在URL栏
    缓存上键入:http://stackoverflow.com/questions/4560400/how-can-i-get-the-google-cache-age-of-any-url-or-web-page

    这将显示页面的最后一次网络缓存。请参见此处:


    但请记住,网页的缓存只会在页面已经在搜索引擎(Google)上建立索引的情况下显示。为此,您需要检查该页面的meta robot标记。

    您可以使用此网站:。任何网站的缓存视图或缓存页面-谷歌缓存任何网站的页面

    wow,它甚至可以在
    robots.txt
    周围工作;我用它来阅读blogger,因为我们的公司防火墙禁用了它的URL。你也可以在Google searchFor
    https
    中使用
    缓存:
    搜索操作符,它需要
    https://
    部分,否则,此站点会自动执行此操作:@lmaoooo请将此添加为单独的答案。我长期以来一直使用此选项。但最近在media.com这样的网站上似乎失败了。
    https://webcache.googleusercontent.com/search?q=cache:<your url without "http://">