Web scraping 在<;a rel=。。。href=>;
我正在尝试使用Web scraping 在<;a rel=。。。href=>;,web-scraping,xpath,css-selectors,rvest,Web Scraping,Xpath,Css Selectors,Rvest,我正在尝试使用rvest包来获取嵌入页面的链接列表。在我使用这样的东西之前: library(rvest) page <- read_html("link") page %>% html_nodes('{a href}') %>% html_attr('href') 库(rvest) 页面%html\u节点('{a href}')%>%html\u属性('href')) 但是,这只提供了与相关的链接,而不是此链接 我的问题是,如何在忽略第一个链接的同时获
rvest
包来获取嵌入页面的链接列表。在我使用这样的东西之前:
library(rvest)
page <- read_html("link")
page %>% html_nodes('{a href}') %>% html_attr('href')
库(rvest)
页面%html\u节点('{a href}')%>%html\u属性('href'))
但是,这只提供了与
相关的链接,而不是此链接
我的问题是,如何在忽略第一个链接的同时获取第二个链接?使用xpath,也许a[@rel]会有所帮助(它会选择所有属性为
rel
的a
元素)。是否使用了html_节点('a[href]')?不确定使用r,但您可能无法在响应头中获得链接。