Python 美如群雄,无类而寻
我有这个html代码(网站是Python 美如群雄,无类而寻,python,beautifulsoup,Python,Beautifulsoup,我有这个html代码(网站是www.kupindo.com): 然后使用: broj.find("a").text 当我做len(broj)时,我得到1(因为只有一个holder分页,我知道)。你应该反过来使用find和find\u all。只有一个保持架分页,因此使用查找: broj = corba.find("div",{"class":"holder_pagination"}) 然后使用find_all查找所有链接: links = broj.find_all("a") 现在您有了
www.kupindo.com
):
然后使用:
broj.find("a").text
当我做
len(broj)
时,我得到1(因为只有一个holder分页,我知道)。你应该反过来使用find
和find\u all
。只有一个保持架分页
,因此使用查找
:
broj = corba.find("div",{"class":"holder_pagination"})
然后使用find_all
查找所有链接:
links = broj.find_all("a")
现在您有了一个链接列表,只需从最后一个链接中选择第二个链接即可:
links[-2].text
我已经用塞尔维亚语写了大部分代码和评论,希望这是提问者理解的最好方式。如果其他人有任何不确定的地方,一定要留下评论
links = broj.find_all("a")
links[-2].text
soup = BeautifulSoup(a,'lxml')
# a is your code above ...<div class="holder_content" style="margin-top:20px">...
broj = soup.find("div",{"class":"holder_pagination"})
find_next = broj.findAll('a',{'class':'next_prev_link'})[1]
if find_next.text == 'Sledeća »':
print("Ima sledece stranica (There's a next page)")
else:
print("Nema sledece stranica (There's no next page)")
broj = soup.find("div",{"class":"holder_pagination"})
try:
find_next = broj.findAll('a',{'class':'next_prev_link'})[1]
except Exception:
print("Doslo je do greske ili smo dosli do kraja, nismo mogli da pronadjemo SLEDECA - stranica")
if find_next.text == 'Sledeća »':
print("Ima Sledeca strana(There's another page)")
pozovemo_neku_funkciju_to_do_something()
# I sad mozemo da otvorimo sledecu stranu najbolje da napravis funkciju za ovo
# I kad otvorimo sledecu stranicu i kad prikupis sve te podatke i ostalo opet na kraju proveravamo da li ima sledeca
# I sve dok ima sledeca nastavljamo sa radnjom
else:
print("Nema sledece stranica (There's no next page)")