Python 如何为后跟特定文本的特定类名提取文本?

Python 如何为后跟特定文本的特定类名提取文本?,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我正在尝试使用Python中的BeautifulSoup收集Web数据。我特别尝试提取不同类型的汽车特征。例如,在下面粘贴的html代码中,我试图将“远程启动”、“导航系统”和“加热方向盘”提取为“方便”功能。有人能告诉我如何提取和存储每个类别的功能吗 这里有一个方法: 导入bs4 您的源代码=“…” soup=bs4.BeautifulSoup(您的源代码“html.parser”) 结果={} 对于soup.find_all(“div”,“class”:“详细功能列表--规范化功能”})中的

我正在尝试使用Python中的BeautifulSoup收集Web数据。我特别尝试提取不同类型的汽车特征。例如,在下面粘贴的html代码中,我试图将“远程启动”、“导航系统”和“加热方向盘”提取为“方便”功能。有人能告诉我如何提取和存储每个类别的功能吗


这里有一个方法:

导入bs4
您的源代码=“…”
soup=bs4.BeautifulSoup(您的源代码“html.parser”)
结果={}
对于soup.find_all(“div”,“class”:“详细功能列表--规范化功能”})中的组:
结果[group.find(“h2”,“class”:“cui-heading-2”}).text]=[itm.text用于组中的itm.find_all(“li”,“class”:“details-feature-list_item”}]
结果是类似于dict的:

{“便利”:[“远程启动”、“导航系统”、“加热方向盘”]}

请不要发布代码图像,而可以发布格式化代码。请包括您已进行的研究以及您当前的编码尝试,指出哪些代码不适用于您当前的代码。发布指南可通过和获得,欢迎您参加。谢谢!这很有效。我对提取特征类别(例如,“便利性”)感到困惑。