Python 在</br>；使用beautifulsoup的标记_Python_Beautifulsoup

Python 在</br>；使用beautifulsoup的标记

python

Python 在</br>；使用beautifulsoup的标记,python,beautifulsoup,Python,Beautifulsoup,我有这个html数据，我需要对其进行解析以从中提取数据。但它有太多的标记，数据对我来说也很难导航。从下面的html数据中，我需要创建一个python字典列表，如下所示： [{“学校”：“儿童” 播放“}，{”地点“：“纽约”}，{”关卡“：“四”}，{”国家“：“美国”}，{”关卡当然“：“容易”}] 学校孩子们的游戏地点级别四级国家美国课程水平轻松我尝试使用beautifulsoup，但没有成功。请帮助不幸的是，HTML的构造并不适合解析，但可以将数据提取到有意义的Pytho

我有这个html数据，我需要对其进行解析以从中提取数据。但它有太多的标记，数据对我来说也很难导航。从下面的html数据中，我需要创建一个python字典列表，如下所示：

[{“学校”：“儿童” 播放“}，{”地点“：“纽约”}，{”关卡“：“四”}，{”国家“：“美国”}，{”关卡当然“：“容易”}]


学校
孩子们的游戏


地点




级别
四级


国家
美国


课程水平
轻松

我尝试使用beautifulsoup，但没有成功。请帮助
不幸的是，HTML的构造并不适合解析，但可以将数据提取到有意义的Python字典中

from BeautifulSoup import BeautifulSoup soup = BeautifulSoup(htmlString) raw_data = soup.find(**{"class": "quick"}).contents data = [x for x in raw_data if not hasattr(x, "name") or not x.name == "br"]
使用
if not hasattr（x，“name”）或not x.name==“br”
首先检查项目是否是
navigablesting
的实例，然后检查元素是否不是
标记

数据
将采用
[，]
的格式，从中提取数据应该是相当简单的。
不幸的是，HTML不是理想的解析格式，但是可以将数据提取到有意义的Python字典中

from BeautifulSoup import BeautifulSoup soup = BeautifulSoup(htmlString) raw_data = soup.find(**{"class": "quick"}).contents data = [x for x in raw_data if not hasattr(x, "name") or not x.name == "br"]
使用
if not hasattr（x，“name”）或not x.name==“br”
首先检查项目是否是
navigablesting
的实例，然后检查元素是否不是
标记

数据
将采用
[，]
格式，从中提取数据应该非常简单