Can';t从rvest中的html_节点提取href链接

Can';t从rvest中的html_节点提取href链接,html,r,web-scraping,xpath,rvest,Html,R,Web Scraping,Xpath,Rvest,当我使用rvest包xpath并尝试从站点获取嵌入链接(足球队名称)时,得到的结果是空的。有人能帮忙吗 代码如下: library(rvest) url <- read_html('https://www.transfermarkt.com/premier-league/startseite/wettbewerb/GB1') xpath <- as.character('/html/body/div[2]/div[11]/div[1]/div[2]/div[2]/di

当我使用rvest包xpath并尝试从站点获取嵌入链接(足球队名称)时,得到的结果是空的。有人能帮忙吗

代码如下:

library(rvest)
 
url <- read_html('https://www.transfermarkt.com/premier-league/startseite/wettbewerb/GB1') 
    
xpath <- as.character('/html/body/div[2]/div[11]/div[1]/div[2]/div[2]/div')

url %>%
  html_node(xpath=xpath) %>% 
  html_attr('href')
库(rvest)
url%
html_attr('href')

您可以通过以下方式获取所有链接:

library(rvest)

url <- 'https://www.transfermarkt.com/premier-league/startseite/wettbewerb/GB1'


url %>%
  read_html %>%
  html_nodes('td.hauptlink a') %>%
  html_attr('href') %>%
  .[. != '#'] %>%
  paste0('https://www.transfermarkt.com', .) %>%
  unique() %>%
  head(20)
库(rvest)
url%
读取\u html%>%
html_节点('td.hauplink a')%>%
html_attr('href')%>%
.[. != '#'] %>%
粘贴0('https://www.transfermarkt.com', .) %>%
唯一()%>%
总目(20)

你想提取哪些链接?@RonakShah我想提取表中的足球队链接。这太棒了!很有效,谢谢。您是如何从中获得css选择器的?右键单击页面并检查元素以找到要提取的相关部分。这很好。因此,你只需在其中添加“a”,因为我在源代码中看不到这一点。
a
用于选择
td.hauplink
之后的锚定标记。表中有20个团队和70个链接-我认为css获取的链接比需要的多。如果不使用gadgetselector,您将如何解决这个问题?