Python BeautifulSoup查找特定类型标记下的所有标记

Python BeautifulSoup查找特定类型标记下的所有标记,python,beautifulsoup,Python,Beautifulsoup,我有一个带有嵌套标记的XML文件,如下所示: <tag1> <tag2>text0</tag2> text1 <tag2>text2</tag2> </tag1> <tag2>text3</tag2> text4 <tag1> <tag2>text5</tag2> </tag1> 有人知道更好的方法吗?您可以使用,例如,选择tag2,它

我有一个带有嵌套标记的XML文件,如下所示:

<tag1>
  <tag2>text0</tag2>
  text1
  <tag2>text2</tag2>
</tag1>
<tag2>text3</tag2>
text4
<tag1>
  <tag2>text5</tag2>
</tag1>
有人知道更好的方法吗?

您可以使用,例如,选择
tag2
,它是
tag1
的直接子级:

tag2entries = soup.select('tag1 > tag2')
tag2entries = soup.select('tag1  tag2')
或者,要在
tag1
中的任何位置选择
tag2

tag2entries = soup.select('tag1 > tag2')
tag2entries = soup.select('tag1  tag2')

您可以使用列表:

entry_list = [entry.text for entry in soup.find_all('tag2') if entry.parent.name == 'tag1']
其结果是:

['text0', 'text2', 'text5']