Python Beautiful Soup在html页面的其他标记之间查找所有出现的标记
我有一个包含以下标签的网页:Python Beautiful Soup在html页面的其他标记之间查找所有出现的标记,python,html,python-2.7,web-scraping,beautifulsoup,Python,Html,Python 2.7,Web Scraping,Beautifulsoup,我有一个包含以下标签的网页: ('span', {'class' : 'block-title'}) ('div', {'class' : 'object-title'}) ('span', {'class' : 'data-value'}) 我可以使用for循环遍历页面,它使用下面的 for a in soup.find_all('span', {'class' : 'block-title'}): print a for b in soup.find_all('div', {'class
('span', {'class' : 'block-title'})
('div', {'class' : 'object-title'})
('span', {'class' : 'data-value'})
我可以使用for循环遍历页面,它使用下面的
for a in soup.find_all('span', {'class' : 'block-title'}):
print a
for b in soup.find_all('div', {'class' : 'object-title'})
print b
for c in soup.find_all('span', {'class' : 'data-value'})
print c
我的问题是,它将它们分为三个单独的列表。我需要代码来查找块标题的第一个匹配项,然后依次查找对象标题和数据值的所有匹配项,然后是下一个块标题等。我认为这可能与“查找下一个”或“查找兄弟”有关,但我正在寻求一些帮助/建议
非常感谢您可以使用第一次
find_all()
调用的结果,并通过将列表传递给下一次find_all()
调用来查找其中的所有相关标记。大概是这样的:
for a in soup.find_all('span', {'class' : 'block-title'}):
print a
for b in print a.find_all(['div', 'span'], {'class' : ['object-title', 'data-value']}):
print b