Python Beautifulsoup刮削未确定数量的编号页

Python Beautifulsoup刮削未确定数量的编号页,python,beautifulsoup,python-requests,pycharm,Python,Beautifulsoup,Python Requests,Pycharm,我正在抓取一个站点并从url中迭代编号的页面,这是我正在使用的代码: base_url = '' #url of the site I’m scraping, only difference is page number at the end. pages = list(map(str,range(1,4))) #change range for how many pages exist url = base_url + pages[0] 这对我所做的工作非常有用,但我在网站上创建了一个不

我正在抓取一个站点并从url中迭代编号的页面,这是我正在使用的代码:

base_url = '' #url of the site I’m scraping, only difference is page number at the end. 
pages = list(map(str,range(1,4))) #change range for how many pages exist 
url = base_url + pages[0]

这对我所做的工作非常有用,但我在网站上创建了一个不同的用户阵列,这些用户都具有不同的功能,但他们都有不同的结束页码。即使没有超过某个页码的内容,网站本身在被刮取时也会继续,直到达到范围为止。有没有一种方法可以让它在没有该用户的内容时停止,从而自动转到阵列中的下一个用户?

解决了这个问题。我所要做的就是查找只存在于包含内容的页面上的元素,并在编号的页面迭代for循环中创建一个if语句,以便在内容不存在时跳出循环,并将范围扩展到一个较大的数字