Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/80.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用rvest从HTML表中提取超链接_Html_R_Web Scraping_Href_Rvest - Fatal编程技术网

用rvest从HTML表中提取超链接

用rvest从HTML表中提取超链接,html,r,web-scraping,href,rvest,Html,R,Web Scraping,Href,Rvest,我在这里看到过类似的问题并实施了解决方案,但似乎仍然无法解决这个问题。还是个新手,所以请容忍我:我已经通过使用rvest获得了一张奥巴马演讲的表格: library(rvest) page <- read_html("http://www.americanrhetoric.com/barackobamaspeeches.htm") speeches <- page %>% html_nodes(xpath = '//*[@id="AutoNumber1"]') %>%

我在这里看到过类似的问题并实施了解决方案,但似乎仍然无法解决这个问题。还是个新手,所以请容忍我:我已经通过使用rvest获得了一张奥巴马演讲的表格:

library(rvest)
page <- read_html("http://www.americanrhetoric.com/barackobamaspeeches.htm")
speeches <- page %>%
  html_nodes(xpath = '//*[@id="AutoNumber1"]') %>% 
  html_table(fill=TRUE)
speeches <- speeches[[1]][,2:4]
head(speeches)
库(rvest)
页数%
html_表(fill=TRUE)
语音使用来确定节点,我使用以下内容提取URL:

page %>% html_nodes("td:nth-child(2) a") %>% html_attr("href")

哇,这么简单的修复。非常感谢!XPath在这种情况下不能工作有什么原因吗?我认为这是因为XPath
id=“AutoNumber1”
没有
href
属性。
page %>% html_nodes("td:nth-child(2) a") %>% html_attr("href")