Python 控制台返回none 12次。共有12幅图像。图像不能被刮掉吗?

Python 控制台返回none 12次。共有12幅图像。图像不能被刮掉吗?,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我正试图建立一个刮板,从这个网站获得所有的列表图像。我知道了如何将所有页面放入一个.txt文件,但在尝试使用此代码创建第一个页面时,控制台12次都没有显示任何页面。不允许刮擦吗 还有,在第一页被删除并进入列表后,如何从.txt文件中提取URL 有6585个URL,每个页面上有12个列表,除了最后一个有2个 import requests from bs4 import BeautifulSoup url = "https://irockdecals.com/shop-decals/?sort=

我正试图建立一个刮板,从这个网站获得所有的列表图像。我知道了如何将所有页面放入一个.txt文件,但在尝试使用此代码创建第一个页面时,控制台12次都没有显示任何页面。不允许刮擦吗

还有,在第一页被删除并进入列表后,如何从.txt文件中提取URL

有6585个URL,每个页面上有12个列表,除了最后一个有2个

import requests
from bs4 import BeautifulSoup

url = "https://irockdecals.com/shop-decals/?sort=bestselling&page=1"

sourceCode = requests.get(url)

plainText = sourceCode.text

soup = BeautifulSoup(plainText, "html.parser")

irock = (soup.find_all('div', class_="card-img-container"))

for img in irock:
    soup.find_all("src")
    bingo = img.get("src")
    print(bingo)

在遍历div元素时,需要在每个div('img')中获取图像,然后为该图像元素获取'src'

import requests
from bs4 import BeautifulSoup

url = "https://irockdecals.com/shop-decals/?sort=bestselling&page=1"

sourceCode = requests.get(url)

plainText = sourceCode.text

soup = BeautifulSoup(plainText, "html.parser")

irock = (soup.find_all('div', class_="card-img-container"))

for img in irock:
    image_element = img.find("img")
    bingo = image_element.get("src")
    print(bingo)

在尝试了一些东西之后,我觉得bs4不是适合您需求的正确选择,因为图像是延迟加载的,我建议使用selenium或类似的东西。如果我获得img src的url,它将与我从每个产品页面获得的文件相同。是的,但问题是,在延迟加载中,最初,您没有得到实际的图像URL,而是在刮取页面时得到一个虚拟加载程序URL。