将源链接URL添加到R中的web抓取数据

将源链接URL添加到R中的web抓取数据,r,web,screen-scraping,R,Web,Screen Scraping,我有链接,我需要刮 我如何将这些链接地址作为变量添加到已删除的数据中,或者只是附加 links for (i in links) { url<- (i) SC <- read_html(url) %>% html_nodes ("NODES") %>% html_text () Data<-rbind(SC) } 如何添加第四个属性作为链接URL 1. "name" 2. "price" 3. "date" 4.

我有链接,我需要刮

我如何将这些链接地址作为变量添加到已删除的数据中,或者只是附加

links
for (i in links)
    {
      url<- (i)
      SC <- read_html(url) %>% html_nodes ("NODES") %>% html_text ()
      Data<-rbind(SC)
    }
如何添加第四个属性作为链接URL

1. "name"
2. "price"
3. "date"
4. "source link address"
还是在另一个专栏? 谢谢

试试这个

library(rvest)
library(magrittr)

links <- c("http://www.mothercare.com/christmas/gifts-for-babies/?q=christmas%27", 
           "http://www.mothercare.com/christmas/christmas-clothing/?q=christmas%27")

Data <- lapply(links, function(x){

  h <- read_html(x)
  items <- h %>% html_nodes(".m-title_link") %>% html_text %>% gsub("\\n", "", .)
  price <- h %>% html_nodes(".m-sales_price") %>% html_text %>% gsub("\\n", "", .)
  urls <- h %>% html_nodes(".m-title_link") %>% xml_attr("href") %>% 
          paste0("http://www.mothercare.com", .)
  data.frame(Name=items, Price=price, Link=x, Urls=urls)

})

Data <- do.call(rbind, Data)

View(Data)
库(rvest)
图书馆(magrittr)
链接%html\u text%>%gsub(\\n“,”,)
URL%html\u节点(“.m-title\u链接”)%%>%xml\u属性(“href”)%%>%
粘贴0(“http://www.mothercare.com", .)
frame(Name=items,Price=Price,Link=x,url=url)
})
数据试试这个

library(rvest)
library(magrittr)

links <- c("http://www.mothercare.com/christmas/gifts-for-babies/?q=christmas%27", 
           "http://www.mothercare.com/christmas/christmas-clothing/?q=christmas%27")

Data <- lapply(links, function(x){

  h <- read_html(x)
  items <- h %>% html_nodes(".m-title_link") %>% html_text %>% gsub("\\n", "", .)
  price <- h %>% html_nodes(".m-sales_price") %>% html_text %>% gsub("\\n", "", .)
  urls <- h %>% html_nodes(".m-title_link") %>% xml_attr("href") %>% 
          paste0("http://www.mothercare.com", .)
  data.frame(Name=items, Price=price, Link=x, Urls=urls)

})

Data <- do.call(rbind, Data)

View(Data)
库(rvest)
图书馆(magrittr)
链接%html\u text%>%gsub(\\n“,”,)
URL%html\u节点(“.m-title\u链接”)%%>%xml\u属性(“href”)%%>%
粘贴0(“http://www.mothercare.com", .)
frame(Name=items,Price=Price,Link=x,url=url)
})

数据而不是这个循环尝试
Data%html\u nodes(“nodes”)%%>%html\u text(),x)}
df使用这个循环,我得到了同一行的I次,并且在末尾只有一个(我想最后一个)链接地址。您可以为实例和相应页面提供一些链接吗。。。我有一个包含12个这样的链接的列表,需要刮取数据并将链接放在其中(这组12个项目来自此页面等等)数据%html_节点(“.date.price.name”)%%>%html_text(),x)})df而不是此循环尝试
数据%html_节点(“节点”)%%>%html_text(),x) })
df通过这一个,我得到了同一行的I次,并且只有一个(我认为是最后一个)链接地址。您可以为实例和相应页面提供一些链接吗。。。我有一个12个这样的链接的列表,需要抓取数据并将链接与它们放在一起(这组12个项目来自这个页面等等)数据%html\u节点(“.date.price.name”)%>%html\u text(),x)})df还有如何获得这些页面中项目的所有链接?我已经更新了我的答案。您应该阅读
rvest
xml2
packagesPERFECT。也谢谢你如何获得这些页面中所有项目的链接?我已经更新了我的答案。您应该阅读
rvest
xml2
packagesPERFECT。非常感谢。