使用RStudio在谷歌搜索中抓取/提取文章日期

使用RStudio在谷歌搜索中抓取/提取文章日期,r,xpath,web-scraping,extract,google-search,R,Xpath,Web Scraping,Extract,Google Search,我试图在谷歌搜索中找到文章的日期。然而,我认为我必须找到正确的XPath来实现这一点。我试图通过开发模式(检查代码)找到它,但我得到了不起作用的/*@id=“rso”]/div[3]/div/div[2]/div/span/span[1] 最接近日期的是这个: 库(rvest) 图书馆(dplyr) web1% html_节点(xpath='//div/div/div/div/div[not(div)])%>% html_文本 它不仅返回日期,还返回一些我不需要的垃圾: [1]“搜索选项” [

我试图在谷歌搜索中找到文章的日期。然而,我认为我必须找到正确的
XPath
来实现这一点。我试图通过开发模式(检查代码)找到它,但我得到了不起作用的
/*@id=“rso”]/div[3]/div/div[2]/div/span/span[1]

最接近日期的是这个:

库(rvest)
图书馆(dplyr)
web1%
html_节点(xpath='//div/div/div/div/div[not(div)])%>%
html_文本
它不仅返回日期,还返回一些我不需要的垃圾:

[1]“搜索选项”
[2] “任何国家”
[3] “任何语言”
[4] “上个月”
[5] “所有结果”
[6] “1.10.2020·为什么创纪录的英国房价可能很快再次下跌。CNN商业频道汉娜·齐亚迪的分析。更新时间:美国东部时间2020年10月1日星期四上午11:49。英国伦敦…”
[7] “英国房地产市场即将崩溃吗?”
[31]“08.10.2020·哪个?解释了英国脱欧过渡期结束后房价可能发生的变化,包括抵押贷款和房地产专家的建议和预测。”
我唯一需要的是日期(2020年10月1日,2020年10月8日)


如何从谷歌的SERP中提取日期?

欢迎使用SO,Alina。请考虑使用谷歌搜索API。