Web scraping 网页抓取搜索结果

Web scraping 网页抓取搜索结果,web-scraping,search-engine,google-search,Web Scraping,Search Engine,Google Search,我需要帮助解决以下问题: 我需要通过谷歌搜索引擎验证特定站点的缓存URL。在这种情况下,url将404或页面将不会呈现一些必要的html元素(被认为是坏的),我需要记录这些url,稍后301重定向到正确的url。我知道PHP和一点Python,但我不确定使用什么方法从给定站点的搜索引擎结果中删除所有URL。-一个简单的html解析器。本页有一个例子;不确定这是否仍然适用于谷歌即时搜索等

我需要帮助解决以下问题:

我需要通过谷歌搜索引擎验证特定站点的缓存URL。在这种情况下,url将404或页面将不会呈现一些必要的html元素(被认为是坏的),我需要记录这些url,稍后301重定向到正确的url。我知道PHP和一点Python,但我不确定使用什么方法从给定站点的搜索引擎结果中删除所有URL。

-一个简单的html解析器。本页有一个例子;不确定这是否仍然适用于谷歌即时搜索等