Can'；t从rvest中的html_节点提取href链接_Html_R_Web Scraping_Xpath_Rvest

Can'；t从rvest中的html_节点提取href链接

html r web-scraping xpath

Can'；t从rvest中的html_节点提取href链接,html,r,web-scraping,xpath,rvest,Html,R,Web Scraping,Xpath,Rvest,当我使用rvest包xpath并尝试从站点获取嵌入链接（足球队名称）时，得到的结果是空的。有人能帮忙吗代码如下： library(rvest) url <- read_html('https://www.transfermarkt.com/premier-league/startseite/wettbewerb/GB1') xpath <- as.character('/html/body/div[2]/div[11]/div[1]/div[2]/div[2]/di

当我使用rvest包xpath并尝试从站点获取嵌入链接（足球队名称）时，得到的结果是空的。有人能帮忙吗

代码如下：

library(rvest)
 
url <- read_html('https://www.transfermarkt.com/premier-league/startseite/wettbewerb/GB1') 
    
xpath <- as.character('/html/body/div[2]/div[11]/div[1]/div[2]/div[2]/div')

url %>%
  html_node(xpath=xpath) %>% 
  html_attr('href')

库（rvest）
url%
html_attr（'href'）

您可以通过以下方式获取所有链接：

library(rvest)

url <- 'https://www.transfermarkt.com/premier-league/startseite/wettbewerb/GB1'


url %>%
  read_html %>%
  html_nodes('td.hauptlink a') %>%
  html_attr('href') %>%
  .[. != '#'] %>%
  paste0('https://www.transfermarkt.com', .) %>%
  unique() %>%
  head(20)

库（rvest）
url%
读取\u html%>%
html_节点（'td.hauplink a'）%>%
html_attr（'href'）%>%
.[. != '#'] %>%
粘贴0（'https://www.transfermarkt.com', .) %>%
唯一（）%>%
总目（20）

你想提取哪些链接？@RonakShah我想提取表中的足球队链接。这太棒了！很有效，谢谢。您是如何从中获得css选择器的？右键单击页面并检查元素以找到要提取的相关部分。这很好。因此，你只需在其中添加“a”，因为我在源代码中看不到这一点。

用于选择

td.hauplink

之后的锚定标记。表中有20个团队和70个链接-我认为css获取的链接比需要的多。如果不使用gadgetselector，您将如何解决这个问题？