Python BeautifulSoup查找特定类型标记下的所有标记
我有一个带有嵌套标记的XML文件,如下所示:Python BeautifulSoup查找特定类型标记下的所有标记,python,beautifulsoup,Python,Beautifulsoup,我有一个带有嵌套标记的XML文件,如下所示: <tag1> <tag2>text0</tag2> text1 <tag2>text2</tag2> </tag1> <tag2>text3</tag2> text4 <tag1> <tag2>text5</tag2> </tag1> 有人知道更好的方法吗?您可以使用,例如,选择tag2,它
<tag1>
<tag2>text0</tag2>
text1
<tag2>text2</tag2>
</tag1>
<tag2>text3</tag2>
text4
<tag1>
<tag2>text5</tag2>
</tag1>
有人知道更好的方法吗?您可以使用,例如,选择tag2
,它是tag1
的直接子级:
tag2entries = soup.select('tag1 > tag2')
tag2entries = soup.select('tag1 tag2')
或者,要在tag1
中的任何位置选择tag2
:
tag2entries = soup.select('tag1 > tag2')
tag2entries = soup.select('tag1 tag2')
您可以使用列表:
entry_list = [entry.text for entry in soup.find_all('tag2') if entry.parent.name == 'tag1']
其结果是:
['text0', 'text2', 'text5']