Python BeautifulSoup查找下一个兄弟姐妹
我有一些关于beautiful soup的html代码问题。我不知道如何浏览整个html文档来找到我正在寻找的其他内容 我有这段代码,可以在下面的html中找到并打印“图腾”一词。我希望能够循环浏览html并找到剩余的“一、二、三”和“租金” 用于查找第一个标记和文本的代码:Python BeautifulSoup查找下一个兄弟姐妹,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我有一些关于beautiful soup的html代码问题。我不知道如何浏览整个html文档来找到我正在寻找的其他内容 我有这段代码,可以在下面的html中找到并打印“图腾”一词。我希望能够循环浏览html并找到剩余的“一、二、三”和“租金” 用于查找第一个标记和文本的代码: print(html.find('td', {'class': 'play'}).next_sibling.next_sibling.text) 让下面的内容作为要刮取的html示例: <tr> &l
print(html.find('td', {'class': 'play'}).next_sibling.next_sibling.text)
让下面的内容作为要刮取的html示例:
<tr>
<td class="play">
<a href="#" class="audio-preview"><span class="play-button as_audio-button"></span></a>
<audio class="as_audio_preview" src="https://shopify.audiosalad.com/" >foo</audio>
</td>
**<td>Totem</td>**
<!--<td>$0.99</td>-->
<td class="buy">
<tr>
<td class="play">
<a href="#" class="audio-preview"><span class="play-button as_audio-button"></span></a>
<audio class="as_audio_preview" src="https://shopify.audiosalad.com/" >foo</audio>
</td>
**<td>One, Two, Three</td>**
<!--<td>$0.99</td>-->
<td class="buy">
<tr>
<td class="play">
<a href="#" class="audio-preview"><span class="play-button as_audio-button"></span></a>
<audio class="as_audio_preview" src="https://shopify.audiosalad.com/" >foo</audio>
</td>
**<td>Rent</td>**
<!--<td>$0.99</td>-->
<td class="buy">
福
**租**
您必须迭代元素,如下所示:
for td in html.find_all('td', {'class': 'play'}):
print(td.next_sibling.next_sibling.text)
试试这个。它应该为您获取您所关注的内容:
from bs4 import BeautifulSoup
soup = BeautifulSoup(content,"lxml")
for items in soup.find_all(class_="play"):
data = items.find_next_sibling().text
print(data)
或者,您也可以这样尝试:
for items in soup.find_all(class_="play"):
data = items.find_next("td").text
print(data)
输出:
Totem
One, Two, Three
Rent
这些节点不是兄弟节点。您是否只寻找BeautifulSoup解决方案?