Python 如何从BeautifulSoup中的项目列表中获取文本

Python 如何从BeautifulSoup中的项目列表中获取文本,python,beautifulsoup,Python,Beautifulsoup,因此,我试图从一个网站上抓取一些数据,而我不能仅仅从html中获取文本,我需要提取数据并将其放在一列CSV文件中 for panel in panel.find_all('p', class_='content-group'): fondateur = panel.find_next_siblings('b') print(fondateur) 我尝试过不同的步骤,比如在索引中循环,但如果我这样做,我就无法在一列中获得创始人的完整列表(如

因此,我试图从一个网站上抓取一些数据,而我不能仅仅从html中获取文本,我需要提取数据并将其放在一列CSV文件中

    for panel in panel.find_all('p', class_='content-group'):
            fondateur = panel.find_next_siblings('b')
            print(fondateur)
我尝试过不同的步骤,比如在索引中循环,但如果我这样做,我就无法在一列中获得创始人的完整列表(如果有多个创始人的话)

    for panel in panel.find_all('p', class_='content-group'):
            fondateur = panel.find_next_siblings('b')
            print(fondateur)
这就是我得到的:

    [<b>Alexandre Bilger</b>, <b>Fabrice de Salaberry</b>, <b>Olivier Gaunet</b>, <b>Cyril De Maleprade</b>]
    [<b>Anne OSDOIT</b>, <b>Gerard HASCOET</b>]
    [<b>Claude Avisse</b>]
    [<b>Nicolas NAIGEON</b>]
    [<b>Jérôme Varnier</b>, <b>Romain Melloul</b>, <b>Vincent Oliveira</b>]
    [<b>Clémentine GUYON </b>, <b>Clémence COURSIMAULT </b>]
    [<b>Maxim  Romain</b>]
[Alexandre Bilger,Fabrice de Salaberry,Olivier Gaunet,Cyril de Maleprade]
[安妮·奥斯多伊特,杰拉德·哈斯科]
[克劳德·阿维斯]
[尼古拉斯·奈金]
[Jérôme Varnier、Romain Melloul、Vincent Oliveira]
[Clémentine GUYON,Clémence COURSIMAULT]
[马克西姆·罗曼]

我所期望的只是名字。

我已经有一段时间没有使用BS了,但它正在使用find_next_兄弟姐妹为您返回列表

看起来你可以绕过去

请尝试以下方法:

for panel in panel.find_all('p', class_='content-group'):
    for name in panel.find_next_siblings('b')
        print(name)

你仍然会在它们周围有粗体标记,这可能是你学习的下一步。

我使用BS已经有一段时间了,但它正在使用find_next_兄弟姐妹为你返回列表

看起来你可以绕过去

请尝试以下方法:

for panel in panel.find_all('p', class_='content-group'):
    for name in panel.find_next_siblings('b')
        print(name)

你仍然会在它们周围有粗体标记,这可能是你学习的下一步。

似乎你已经掌握了正确的元素

从这里开始,您只需对每个元素使用
getText()
,即可获得文本内容,并使用列表理解“展平”列表

试试这个:

names=[fondateur.getText()用于面板中的面板。查找面板中fondateur的所有('p',class='content-group')。查找下一个兄弟姐妹('b')]
打印(姓名)

看起来您已经找到了正确的元素

从这里开始,您只需对每个元素使用
getText()
,即可获得文本内容,并使用列表理解“展平”列表

试试这个:

names=[fondateur.getText()用于面板中的面板。查找面板中fondateur的所有('p',class='content-group')。查找下一个兄弟姐妹('b')]
打印(姓名)

您可以共享URL以便我们看到您需要提取哪些信息吗?这是网站:您可以共享URL以便我们看到您需要提取哪些信息吗?这是网站:如果我这样做,我只能得到创始人的一个名字,我必须得到所有的名字如果我这样做,我只能得到创始人的一个名字,我必须得到所有的名字