Python 美丽的汤-提取所有标题、段落
我不仅需要页面内容,还需要与最终文档中每个标题相关联的格式,而不仅仅是不突出标题的文本。e、 g.将所有标题格式化为粗体 到目前为止,我只提取了我的部门的文本,包括所有标题和段落:Python 美丽的汤-提取所有标题、段落,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我不仅需要页面内容,还需要与最终文档中每个标题相关联的格式,而不仅仅是不突出标题的文本。e、 g.将所有标题格式化为粗体 到目前为止,我只提取了我的部门的文本,包括所有标题和段落: from bs4 import BeautifulSoup soup = BeautifulSoup(page.content, 'html.parser') t=soup.find_all('div',class_=['x']) df=[] for i in t: for
from bs4 import BeautifulSoup
soup = BeautifulSoup(page.content, 'html.parser')
t=soup.find_all('div',class_=['x'])
df=[]
for i in t:
for head in i:
df.append(i.get_text())
我现在需要的是,将文本提取为标题,然后再提取下一段,这样我就可以设置标题的格式。因此,我想迭代所有标题,提取标题,然后是段落文本……有人给我一个建议吗?我建议你给出你试图解析的页面的URL,并显示它的输出应该是什么样子。我们将能够进一步帮助您。