我怎样才能报废2号<;a>;标签';s在python中与BeautifulSoup的链接

我怎样才能报废2号<;a>;标签';s在python中与BeautifulSoup的链接,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,这是要从中刮取的html代码 <div class="archive-pagination pagination"> <ul> <li class="active" > <a href="https://random.com/" aria-label="Current page" aria-current="page">1</a> <

这是要从中刮取的html代码

<div class="archive-pagination pagination">
<ul>
<li class="active" >
<a href="https://random.com/" aria-label="Current page" aria-current="page">1</a>
</li>
<li>
<a href="https://google.com/">2</a>
</li>

一种方法:

soup.select('div.active-pagination a')[1]['href']

它是干什么的?选择具有类活动分页的div中的所有“a”标记,然后选择第二个标记。如果要选择所有没有
aria label
属性的“a”标记,请参见我假设您正在分页中查找下一个页码。为此,我将采用以下方法:

soup.find('div', class_='pagination').find_all('a', attrs={'aria-label':None})
这将列出不是当前页面的a标记