Python 在抓取网页时,如何检查数据是否不存在,然后传递其他行
嗨,我正试图通过网页抓取获取数据,但在页面中,有时我请求的标记不可用,因此,如果这些数据不可用,我需要传递这些数据,或者我如何使用它们的标记获取这些数据Python 在抓取网页时,如何检查数据是否不存在,然后传递其他行,python,html,json,web-scraping,Python,Html,Json,Web Scraping,嗨,我正试图通过网页抓取获取数据,但在页面中,有时我请求的标记不可用,因此,如果这些数据不可用,我需要传递这些数据,或者我如何使用它们的标记获取这些数据 import requests from bs4 import BeautifulSoup from datetime import datetime header = {'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-U
import requests
from bs4 import BeautifulSoup
from datetime import datetime
header = {'User-Agent': 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7'}
base_url = "https://www.avva.com.tr/outlet"
main_url = "https://www.avva.com.tr"
r = requests.get(base_url, headers=header)
if r.status_code == 200:
soup = BeautifulSoup(r.text, 'html.parser')
books = soup.find_all('div', attrs={"class": "ItemOrj col-3"})
my_date = datetime.now()
result = []
for book in books:
title = book.find('a')['title']
link = main_url+book.find('a')['href']
picture = book.find('img')['src']
print(picture)
else:
print(r.status_code)
尝试首先选择
img
对象,并测试它是否与None
不同。如果是,则选择src
picture=book.find('img'))
如果图片=无:
picture\u src=book.find('img')['src']
印刷品(图片)
如果不是book.find('img'):请在picture=book.find('img')['src']之前继续使用这一行。