在R中进行谷歌网页抓取时获取链接

在R中进行谷歌网页抓取时获取链接,r,web-scraping,rvest,R,Web Scraping,Rvest,我试图在搜索时获得谷歌的链接,也就是说,所有这些链接: 我做过这种刮削,但在这种情况下,我不明白为什么它不工作,所以我运行以下行: library(rvest) url<-"https://www.google.es/search?q=Ediciones+Peña+sl+telefono" content_request<-read_html(url) content_request %>% html_nodes(".r") %>% html_attr(

我试图在搜索时获得谷歌的链接,也就是说,所有这些链接:

我做过这种刮削,但在这种情况下,我不明白为什么它不工作,所以我运行以下行:

library(rvest)
url<-"https://www.google.es/search?q=Ediciones+Peña+sl+telefono"
content_request<-read_html(url)
content_request %>%
    html_nodes(".r") %>%
    html_attr("href")
最后,我尝试获取网页的所有链接,但有些链接我无法下载:

html_attr(html_nodes(content_request, "a"), "href")

拜托,你能帮我解决这个问题吗?谢谢。

这里有两个选项供您选择

#1) 

url <- "https://www.google.es/search?q=Ediciones+Pe%C3%B1a+sl+telefono"
html <- paste(readLines(url), collapse="\n")
library(stringr)
matched <- str_match_all(html, "<a href=\"(.*?)\"")


#2) 

library(xml2)
library(rvest)
URL <- "https://www.google.es/search?q=Ediciones+Pe%C3%B1a+sl+telefono"
pg <- read_html(URL)
head(html_attr(html_nodes(pg, "a"), "href"))
#1)

url这里有两个选项供您使用

#1) 

url <- "https://www.google.es/search?q=Ediciones+Pe%C3%B1a+sl+telefono"
html <- paste(readLines(url), collapse="\n")
library(stringr)
matched <- str_match_all(html, "<a href=\"(.*?)\"")


#2) 

library(xml2)
library(rvest)
URL <- "https://www.google.es/search?q=Ediciones+Pe%C3%B1a+sl+telefono"
pg <- read_html(URL)
head(html_attr(html_nodes(pg, "a"), "href"))
#1)

url在第一种情况下,您获得的链接比显示的多,在第二种情况下,您获得的链接比显示的少。在第一种情况下,您获得的链接比显示的多,在第二种情况下,您获得的链接比显示的少。