在R中抓取Twitter图像对象URL_R_Web Scraping_Twitter_Rvest

在R中抓取Twitter图像对象URL

r web-scraping twitter

在R中抓取Twitter图像对象URL,r,web-scraping,twitter,rvest,R,Web Scraping,Twitter,Rvest,我试图使用rvest在twitter媒体URL（即）上抓取图像，但我仍然得到空的html文档。有一个html层次结构，但元素中没有任何内容。例如： library(rvest) library(imager) media <- read_html('https://pbs.twimg.com/media/DnLh3aJV4AANzdJ.jpg') #Scrape the media url for the image twt_img <- media %>% html_

我试图使用rvest在twitter媒体URL（即）上抓取图像，但我仍然得到空的html文档。有一个html层次结构，但元素中没有任何内容。例如：

library(rvest)
library(imager)

media <- read_html('https://pbs.twimg.com/media/DnLh3aJV4AANzdJ.jpg')
#Scrape the media url for the image
twt_img <- media %>% 
  html_nodes('img') %>% 
  html_attr('src')
twt_img
plot(load.image(twt_img))

库（rvest）
图书馆（成像仪）
媒体%
html_attr（'src'）
行波管
绘图（加载图像（twt\U img））

然而，当我运行这段代码时，我得到了一个带有

视图（媒体）

的html结构，但似乎没有不是字符（0）或NA输出的元素。有人知道如何解决这个问题，或者为什么会这样吗

我可以运行在这里找到的图像抓取教程：但出于某种原因，在Twitter上，html对我的解释很奇怪

提前谢谢

在代码中，您从一开始就访问jpg文件。您希望阅读该图片所在的网页。在该教程中，他们识别了一个类似于您的

read\u html（）

中的URL。有了图像的路径后，您可以尝试使用

download.file（）

下载图像。@jazzurro，谢谢！这实际上对我帮助很大。为了使我能够充实我必须做的事情，以便保存这个特定的图像，我所需要的只是：下载.file（“”，'filename.jpg'），并将jpg文件保存到当前的工作目录中作为'filename.jpg'。我很高兴您找到了解决方案。