从www.zoobashop.com以R格式进行网页抓取图像_R_Image_Web Scraping_Screen Scraping_Rvest

从www.zoobashop.com以R格式进行网页抓取图像

r image web-scraping

从www.zoobashop.com以R格式进行网页抓取图像,r,image,web-scraping,screen-scraping,rvest,R,Image,Web Scraping,Screen Scraping,Rvest,我正在为我的分类算法收集蜡像首先，我恢复了图像块的所有链接。每个块包含1或2个图像，我想得到回链接例如，在此块链接上：库（rvest） html% html_attr（“src”） } 获取\u块\u img（html）结果我收到了字符（0）有人能帮我吗？当javascript在浏览器中运行时，它会从脚本标记中动态检索。您可以改为从响应文本中使用正则表达式 library(rvest) library(stringr) link <- str_match(read_htm

我正在为我的分类算法收集蜡像

首先，我恢复了图像块的所有链接。每个块包含1或2个图像，我想得到回链接

例如，在此块链接上：

库（rvest）
html%
html_attr（“src”）
}
获取\u块\u img（html）

结果我收到了 字符（0）

有人能帮我吗？

当javascript在浏览器中运行时，它会从脚本标记中动态检索。您可以改为从响应文本中使用正则表达式

library(rvest)
library(stringr)

link <- str_match(read_html('https://www.zoobashop.com/woodin-fusion-de-woodin-wo29gha-29017-6-yards.html') %>%
        html_text(),'"data": .*?"img":"(.*?)"' )[1,2]

库（rvest）
图书馆（stringr）
链接%
html_text（），“数据”：..“img”：“（.*）”）[1,2]

我找不到相应的css节点来检索图像对不起，我还没有查看该网站，因此我的建议可能不适用。如果找不到元素，可能需要通过无头浏览器加载页面，并在后台触发所有javascript。谢谢@QHarr的回答。但是有了这个代码，我总是得到一个图像是的，我只是用

“data”：.*？“img”：“（.*）”

“data”：.*？“img”：“（.*？“img””）替换了这个模式，这很好，所以你在上面的评论中使用了第一个模式，对吗？是的。非常感谢。

library(rvest)
library(stringr)

link <- str_match(read_html('https://www.zoobashop.com/woodin-fusion-de-woodin-wo29gha-29017-6-yards.html') %>%
        html_text(),'"data": .*?"img":"(.*?)"' )[1,2]