我怎样才能报废2号<；a>；标签'；s在python中与BeautifulSoup的链接_Python_Web Scraping_Beautifulsoup

我怎样才能报废2号<；a>；标签'；s在python中与BeautifulSoup的链接

python web-scraping

我怎样才能报废2号<；a>；标签'；s在python中与BeautifulSoup的链接,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,这是要从中刮取的html代码 <div class="archive-pagination pagination"> <ul> <li class="active" > <a href="https://random.com/" aria-label="Current page" aria-current="page">1</a> <

这是要从中刮取的html代码

<div class="archive-pagination pagination">
<ul>
<li class="active" >
<a href="https://random.com/" aria-label="Current page" aria-current="page">1</a>
</li>
<li>
<a href="https://google.com/">2</a>
</li>

一种方法：

soup.select（'div.active-pagination a'）[1]['href']

它是干什么的？选择具有类活动分页的div中的所有“a”标记，然后选择第二个标记。如果要选择所有没有

aria label

属性的“a”标记，请参见我假设您正在分页中查找下一个页码。为此，我将采用以下方法：

soup.find('div', class_='pagination').find_all('a', attrs={'aria-label':None})

这将列出不是当前页面的a标记