用rvest从HTML表中提取超链接_Html_R_Web Scraping_Href_Rvest

用rvest从HTML表中提取超链接

html r web-scraping

用rvest从HTML表中提取超链接,html,r,web-scraping,href,rvest,Html,R,Web Scraping,Href,Rvest,我在这里看到过类似的问题并实施了解决方案，但似乎仍然无法解决这个问题。还是个新手，所以请容忍我：我已经通过使用rvest获得了一张奥巴马演讲的表格： library(rvest) page <- read_html("http://www.americanrhetoric.com/barackobamaspeeches.htm") speeches <- page %>% html_nodes(xpath = '//*[@id="AutoNumber1"]') %>%

我在这里看到过类似的问题并实施了解决方案，但似乎仍然无法解决这个问题。还是个新手，所以请容忍我：我已经通过使用rvest获得了一张奥巴马演讲的表格：

library(rvest)
page <- read_html("http://www.americanrhetoric.com/barackobamaspeeches.htm")
speeches <- page %>%
  html_nodes(xpath = '//*[@id="AutoNumber1"]') %>% 
  html_table(fill=TRUE)
speeches <- speeches[[1]][,2:4]
head(speeches)

库（rvest）
页数%
html_表（fill=TRUE）
语音使用来确定节点，我使用以下内容提取URL：
page %>% html_nodes("td:nth-child(2) a") %>% html_attr("href")

哇，这么简单的修复。非常感谢！XPath在这种情况下不能工作有什么原因吗？我认为这是因为XPathid=“AutoNumber1”
没有href属性。
page %>% html_nodes("td:nth-child(2) a") %>% html_attr("href")