Python 如何在beautiful soup中返回标记的元素?
真正基本的问题是: 我将如何从以下位置返回001、002…101:Python 如何在beautiful soup中返回标记的元素?,python,python-3.x,beautifulsoup,bs4,Python,Python 3.x,Beautifulsoup,Bs4,真正基本的问题是: 我将如何从以下位置返回001、002…101: <us-applicant sequence="001" app-type="applicant" designation="us-only"> ... <us-applicant sequence="101" app-type="applicant" designation="us-only"> ... 用漂亮的汤?我知道在两个标记之间返回某些内容的基本外观,但我不确定该元素实际上是什么您可以这样
<us-applicant sequence="001" app-type="applicant" designation="us-only">
...
<us-applicant sequence="101" app-type="applicant" designation="us-only">
...
用漂亮的汤?我知道在两个标记之间返回某些内容的基本外观,但我不确定该元素实际上是什么您可以这样做,使用列表理解,使用
['sequence']
获取属性:
from bs4 import BeautifulSoup
data = '''
<us-applicant sequence="001" app-type="applicant" designation="us-only">
<us-applicant sequence="100" app-type="applicant" designation="us-only">
<us-applicant sequence="101" app-type="applicant" designation="us-only">
'''
soup = BeautifulSoup(data, 'html.parser')
>>> [tag['sequence'] for tag in soup.findAll('us-applicant')]
['001', '100', '101']
从bs4导入美化组
数据=“”
'''
soup=BeautifulSoup(数据'html.parser')
>>>[tag['sequence']表示汤中的tag.findAll(“美国申请人”)]
['001', '100', '101']