Javascript 在抓取图像src时获取base64字符串

Javascript 在抓取图像src时获取base64字符串,javascript,base64,screen-scraping,Javascript,Base64,Screen Scraping,我从网站上抓取了图片src、标题、价格等,但它给出了base64字符串来代替图片src。当我将所有这些刮取的数据附加到uri时,它会显示错误长uri。如何减缓此问题?如果您得到一个base64字符串作为img src,听起来好像图像是内联编码的 数据:URI是一种非常有用的方法,可以将小数据项嵌入到 URL而不是指向外部资源的链接,URL包含 实际编码数据 嵌入小红点图片的HTML片段: <img src="data:image/png;base64,iVBORw0KGgoAAAANSU

我从网站上抓取了图片src、标题、价格等,但它给出了base64字符串来代替图片src。当我将所有这些刮取的数据附加到uri时,它会显示错误长uri。如何减缓此问题?

如果您得到一个base64字符串作为img src,听起来好像图像是内联编码的

数据:URI是一种非常有用的方法,可以将小数据项嵌入到 URL而不是指向外部资源的链接,URL包含 实际编码数据

嵌入小红点图片的HTML片段:

<img src="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUA
AAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO
9TXL0Y4OHwAAAABJRU5ErkJggg==" alt="Red dot" />

在上面的示例中,如果您要对字符串进行base64解码(减去
数据:image/png,base64,
部分),您将获得可以作为文件写入磁盘的png图像的数据


有没有办法获得实际链接而不是这个基本链接?关键是没有链接。服务器上没有可以通过URL访问的文件,而是图像的数据是base64编码字符串。请删除类似于
data:image/png,base64,
的位,然后使用base64解码功能处理剩余的文件。在PHP中是
base64_decode
,在Javascript中是
atob
谢谢,这与上面的评论非常有用。当我在浏览器中检查元素时,我肯定会看到url,但当我使用Scrapy时,它会将其转换为base64编码字符串。啊。