Python 控制台返回none 12次。共有12幅图像。图像不能被刮掉吗？_Python_Web Scraping_Beautifulsoup

Python 控制台返回none 12次。共有12幅图像。图像不能被刮掉吗？

python web-scraping

Python 控制台返回none 12次。共有12幅图像。图像不能被刮掉吗？,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我正试图建立一个刮板，从这个网站获得所有的列表图像。我知道了如何将所有页面放入一个.txt文件，但在尝试使用此代码创建第一个页面时，控制台12次都没有显示任何页面。不允许刮擦吗还有，在第一页被删除并进入列表后，如何从.txt文件中提取URL 有6585个URL，每个页面上有12个列表，除了最后一个有2个 import requests from bs4 import BeautifulSoup url = "https://irockdecals.com/shop-decals/?sort=

我正试图建立一个刮板，从这个网站获得所有的列表图像。我知道了如何将所有页面放入一个.txt文件，但在尝试使用此代码创建第一个页面时，控制台12次都没有显示任何页面。不允许刮擦吗

还有，在第一页被删除并进入列表后，如何从.txt文件中提取URL

有6585个URL，每个页面上有12个列表，除了最后一个有2个

import requests
from bs4 import BeautifulSoup

url = "https://irockdecals.com/shop-decals/?sort=bestselling&page=1"

sourceCode = requests.get(url)

plainText = sourceCode.text

soup = BeautifulSoup(plainText, "html.parser")

irock = (soup.find_all('div', class_="card-img-container"))

for img in irock:
    soup.find_all("src")
    bingo = img.get("src")
    print(bingo)

在遍历div元素时，需要在每个div（'img'）中获取图像，然后为该图像元素获取'src'

import requests
from bs4 import BeautifulSoup

url = "https://irockdecals.com/shop-decals/?sort=bestselling&page=1"

sourceCode = requests.get(url)

plainText = sourceCode.text

soup = BeautifulSoup(plainText, "html.parser")

irock = (soup.find_all('div', class_="card-img-container"))

for img in irock:
    image_element = img.find("img")
    bingo = image_element.get("src")
    print(bingo)

在尝试了一些东西之后，我觉得bs4不是适合您需求的正确选择，因为图像是延迟加载的，我建议使用selenium或类似的东西。如果我获得img src的url，它将与我从每个产品页面获得的文件相同。是的，但问题是，在延迟加载中，最初，您没有得到实际的图像URL，而是在刮取页面时得到一个虚拟加载程序URL。