Python 如何从BeautifulSoup中的项目列表中获取文本
因此,我试图从一个网站上抓取一些数据,而我不能仅仅从html中获取文本,我需要提取数据并将其放在一列CSV文件中Python 如何从BeautifulSoup中的项目列表中获取文本,python,beautifulsoup,Python,Beautifulsoup,因此,我试图从一个网站上抓取一些数据,而我不能仅仅从html中获取文本,我需要提取数据并将其放在一列CSV文件中 for panel in panel.find_all('p', class_='content-group'): fondateur = panel.find_next_siblings('b') print(fondateur) 我尝试过不同的步骤,比如在索引中循环,但如果我这样做,我就无法在一列中获得创始人的完整列表(如
for panel in panel.find_all('p', class_='content-group'):
fondateur = panel.find_next_siblings('b')
print(fondateur)
我尝试过不同的步骤,比如在索引中循环,但如果我这样做,我就无法在一列中获得创始人的完整列表(如果有多个创始人的话)
for panel in panel.find_all('p', class_='content-group'):
fondateur = panel.find_next_siblings('b')
print(fondateur)
这就是我得到的:
[<b>Alexandre Bilger</b>, <b>Fabrice de Salaberry</b>, <b>Olivier Gaunet</b>, <b>Cyril De Maleprade</b>]
[<b>Anne OSDOIT</b>, <b>Gerard HASCOET</b>]
[<b>Claude Avisse</b>]
[<b>Nicolas NAIGEON</b>]
[<b>Jérôme Varnier</b>, <b>Romain Melloul</b>, <b>Vincent Oliveira</b>]
[<b>Clémentine GUYON </b>, <b>Clémence COURSIMAULT </b>]
[<b>Maxim Romain</b>]
[Alexandre Bilger,Fabrice de Salaberry,Olivier Gaunet,Cyril de Maleprade]
[安妮·奥斯多伊特,杰拉德·哈斯科]
[克劳德·阿维斯]
[尼古拉斯·奈金]
[Jérôme Varnier、Romain Melloul、Vincent Oliveira]
[Clémentine GUYON,Clémence COURSIMAULT]
[马克西姆·罗曼]
我所期望的只是名字。我已经有一段时间没有使用BS了,但它正在使用find_next_兄弟姐妹为您返回列表 看起来你可以绕过去 请尝试以下方法:
for panel in panel.find_all('p', class_='content-group'):
for name in panel.find_next_siblings('b')
print(name)
你仍然会在它们周围有粗体标记,这可能是你学习的下一步。我使用BS已经有一段时间了,但它正在使用find_next_兄弟姐妹为你返回列表 看起来你可以绕过去 请尝试以下方法:
for panel in panel.find_all('p', class_='content-group'):
for name in panel.find_next_siblings('b')
print(name)
你仍然会在它们周围有粗体标记,这可能是你学习的下一步。似乎你已经掌握了正确的元素 从这里开始,您只需对每个元素使用
getText()
,即可获得文本内容,并使用列表理解“展平”列表
试试这个:
names=[fondateur.getText()用于面板中的面板。查找面板中fondateur的所有('p',class='content-group')。查找下一个兄弟姐妹('b')]
打印(姓名)
看起来您已经找到了正确的元素
从这里开始,您只需对每个元素使用getText()
,即可获得文本内容,并使用列表理解“展平”列表
试试这个:
names=[fondateur.getText()用于面板中的面板。查找面板中fondateur的所有('p',class='content-group')。查找下一个兄弟姐妹('b')]
打印(姓名)
您可以共享URL以便我们看到您需要提取哪些信息吗?这是网站:您可以共享URL以便我们看到您需要提取哪些信息吗?这是网站:如果我这样做,我只能得到创始人的一个名字,我必须得到所有的名字如果我这样做,我只能得到创始人的一个名字,我必须得到所有的名字