从www.zoobashop.com以R格式进行网页抓取图像
我正在为我的分类算法收集蜡像 首先,我恢复了图像块的所有链接。每个块包含1或2个图像,我想得到回链接 例如,在此块链接上:从www.zoobashop.com以R格式进行网页抓取图像,r,image,web-scraping,screen-scraping,rvest,R,Image,Web Scraping,Screen Scraping,Rvest,我正在为我的分类算法收集蜡像 首先,我恢复了图像块的所有链接。每个块包含1或2个图像,我想得到回链接 例如,在此块链接上: 库(rvest) html% html_attr(“src”) } 获取\u块\u img(html) 结果我收到了 字符(0) 有人能帮我吗?当javascript在浏览器中运行时,它会从脚本标记中动态检索。您可以改为从响应文本中使用正则表达式 library(rvest) library(stringr) link <- str_match(read_htm
库(rvest)
html%
html_attr(“src”)
}
获取\u块\u img(html)
结果我收到了
字符(0)
有人能帮我吗?当javascript在浏览器中运行时,它会从脚本标记中动态检索。您可以改为从响应文本中使用正则表达式
library(rvest)
library(stringr)
link <- str_match(read_html('https://www.zoobashop.com/woodin-fusion-de-woodin-wo29gha-29017-6-yards.html') %>%
html_text(),'"data": .*?"img":"(.*?)"' )[1,2]
库(rvest)
图书馆(stringr)
链接%
html_text(),“数据”:..“img”:“(.*)”)[1,2]
我找不到相应的css节点来检索图像对不起,我还没有查看该网站,因此我的建议可能不适用。如果找不到元素,可能需要通过无头浏览器加载页面,并在后台触发所有javascript。谢谢@QHarr的回答。但是有了这个代码,我总是得到一个图像是的,我只是用“data”:.*?“img”:“(.*)”
“data”:.*?“img”:“(.*?“img””)替换了这个模式,这很好,所以你在上面的评论中使用了第一个模式,对吗?是的。非常感谢。
library(rvest)
library(stringr)
link <- str_match(read_html('https://www.zoobashop.com/woodin-fusion-de-woodin-wo29gha-29017-6-yards.html') %>%
html_text(),'"data": .*?"img":"(.*?)"' )[1,2]