Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/84.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Html 使用Rvest从网站中删除Web链接_Html_R_Web Scraping_Rvest - Fatal编程技术网

Html 使用Rvest从网站中删除Web链接

Html 使用Rvest从网站中删除Web链接,html,r,web-scraping,rvest,Html,R,Web Scraping,Rvest,我是新来的拉网高手。我目前正在抓取一个房地产网站,但我没有抓取具体报价的链接 当使用下面的代码时,我得到了网站上的每个链接,我不太确定如何过滤它,它只会刮取20个地产报价的链接。也许你能帮我 查看源代码/检查元素到目前为止对我没有帮助 url <- immo_webp %>% html_nodes("a") %>% html_attr("href") 您可以将文章标记作为目标,然后通过与基本字符串连接,从dataobid属性构造URL library(rvest)

我是新来的拉网高手。我目前正在抓取一个房地产网站,但我没有抓取具体报价的链接

当使用下面的代码时,我得到了网站上的每个链接,我不太确定如何过滤它,它只会刮取20个地产报价的链接。也许你能帮我

查看源代码/检查元素到目前为止对我没有帮助

url <- immo_webp %>%

  html_nodes("a") %>%

  html_attr("href")
您可以将文章标记作为目标,然后通过与基本字符串连接,从dataobid属性构造URL

library(rvest)
library(magrittr)

base = 'https://www.immobilienscout24.de/expose/'

urls <- lapply(read_html("https://www.immobilienscout24.de/Suche/S-T/Wohnung-Miete/Rheinland-Pfalz/Koblenz?enteredFrom=one_step_search")%>%
       html_nodes('article')%>%
       html_attr('data-obid'), function (url){paste0(base, url)})
print(urls)

我建议你看看这个。