Python 美丽的汤-提取所有标题、段落

Python 美丽的汤-提取所有标题、段落,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我不仅需要页面内容,还需要与最终文档中每个标题相关联的格式,而不仅仅是不突出标题的文本。e、 g.将所有标题格式化为粗体 到目前为止,我只提取了我的部门的文本,包括所有标题和段落: from bs4 import BeautifulSoup soup = BeautifulSoup(page.content, 'html.parser') t=soup.find_all('div',class_=['x']) df=[] for i in t: for

我不仅需要页面内容,还需要与最终文档中每个标题相关联的格式,而不仅仅是不突出标题的文本。e、 g.将所有标题格式化为粗体

到目前为止,我只提取了我的部门的文本,包括所有标题和段落:

from bs4 import BeautifulSoup


soup = BeautifulSoup(page.content, 'html.parser')


t=soup.find_all('div',class_=['x'])

    df=[]
    for i in t:
        for head in i:
            df.append(i.get_text())

我现在需要的是,将文本提取为标题,然后再提取下一段,这样我就可以设置标题的格式。因此,我想迭代所有标题,提取标题,然后是段落文本……

有人给我一个建议吗?我建议你给出你试图解析的页面的URL,并显示它的输出应该是什么样子。我们将能够进一步帮助您。