在R中抓取Twitter图像对象URL
我试图使用rvest在twitter媒体URL(即)上抓取图像,但我仍然得到空的html文档。有一个html层次结构,但元素中没有任何内容。例如:在R中抓取Twitter图像对象URL,r,web-scraping,twitter,rvest,R,Web Scraping,Twitter,Rvest,我试图使用rvest在twitter媒体URL(即)上抓取图像,但我仍然得到空的html文档。有一个html层次结构,但元素中没有任何内容。例如: library(rvest) library(imager) media <- read_html('https://pbs.twimg.com/media/DnLh3aJV4AANzdJ.jpg') #Scrape the media url for the image twt_img <- media %>% html_
library(rvest)
library(imager)
media <- read_html('https://pbs.twimg.com/media/DnLh3aJV4AANzdJ.jpg')
#Scrape the media url for the image
twt_img <- media %>%
html_nodes('img') %>%
html_attr('src')
twt_img
plot(load.image(twt_img))
库(rvest)
图书馆(成像仪)
媒体%
html_attr('src')
行波管
绘图(加载图像(twt\U img))
然而,当我运行这段代码时,我得到了一个带有视图(媒体)
的html结构,但似乎没有不是字符(0)或NA输出的元素。有人知道如何解决这个问题,或者为什么会这样吗
我可以运行在这里找到的图像抓取教程:但出于某种原因,在Twitter上,html对我的解释很奇怪
提前谢谢 在代码中,您从一开始就访问jpg文件。您希望阅读该图片所在的网页。在该教程中,他们识别了一个类似于您的
read\u html()
中的URL。有了图像的路径后,您可以尝试使用download.file()
下载图像。@jazzurro,谢谢!这实际上对我帮助很大。为了使我能够充实我必须做的事情,以便保存这个特定的图像,我所需要的只是:下载.file(“”,'filename.jpg'),并将jpg文件保存到当前的工作目录中作为'filename.jpg'。我很高兴您找到了解决方案。