Python 每小时检查一次外部网站上是否存在特定的html类

Python 每小时检查一次外部网站上是否存在特定的html类,python,beautifulsoup,Python,Beautifulsoup,我想每隔几个小时检查一些特定课程的外部链接。 例如,我有两个链接: https://nike.com/product-1/ https://adidas.com/product1/ 在每个链接上,我想每隔几个小时检查一次是否存在特定的类。更确切地说,我想检查每种尺寸(S、M、L、XL…)的库存可用性 如果这两个链接中的任何尺寸“缺货”,我希望收到一封带有消息的电子邮件 从我的研究中,我发现我可以使用Python库从HTML中提取数据 这就是我的出发点: import requests from

我想每隔几个小时检查一些特定课程的外部链接。 例如,我有两个链接:

https://nike.com/product-1/
https://adidas.com/product1/
在每个链接上,我想每隔几个小时检查一次是否存在特定的类。更确切地说,我想检查每种尺寸(S、M、L、XL…)的库存可用性

如果这两个链接中的任何尺寸“缺货”,我希望收到一封带有消息的电子邮件

从我的研究中,我发现我可以使用Python库从HTML中提取数据

这就是我的出发点:

import requests
from bs4 import BeautifulSoup

result = requests.get("https://nike.com/product-1/")
src = result.content
soup = BeautifulSoup(src, 'lxml')

stock = []
for h2_tag in soup.find_all('h2'):
a_tag = h2_tag.find('a')

print(urls)
这看起来很复杂,这只是一个开始。。。我的印象是,可能有更简单的方法来做到这一点


最简单的方法是什么

检查他们的网络活动,看看是否有人用api调用填充页面。正如建议的那样,您可以检查并看看是否可以从api获得良好的json响应。如果不是,那么可能需要使用Selenium,因为我假设这些页面将是动态的,并在初始页面请求之后呈现。你能提供2个特定的链接而不是2个通用的示例链接(因为这两个链接实际上没有返回任何内容),这样我就可以四处看看了吗?@chitown88恐怕我不能使用API,因为没有API。这里有两个特定的链接:@agis,如果是这样的话,那么你很可能需要使用某种类型的自动浏览器。我现在就来看看我能想出什么。@agis,棘手的是你要检查不同的站点,每个站点都有不同的布局/结构。因此,检查一个特定的类可能很困难,因为每个站点可能有一个不同的字符串来表示它的类的大小。因此,您可能需要为每个基本站点创建不同的函数。检查它们的网络活动,以查看是否有任何函数使用api调用填充页面。如建议的,您可以检查并查看是否可以从api获得良好的json响应。如果不是,那么可能需要使用Selenium,因为我假设这些页面将是动态的,并在初始页面请求之后呈现。你能提供2个特定的链接而不是2个通用的示例链接(因为这两个链接实际上没有返回任何内容),这样我就可以四处看看了吗?@chitown88恐怕我不能使用API,因为没有API。这里有两个特定的链接:@agis,如果是这样的话,那么你很可能需要使用某种类型的自动浏览器。我现在就来看看我能想出什么。@agis,棘手的是你要检查不同的站点,每个站点都有不同的布局/结构。因此,检查一个特定的类可能很困难,因为每个站点可能有一个不同的字符串来表示它的类的大小。因此,您可能需要为每个基本站点创建不同的函数。