Python 在</br>;使用beautifulsoup的标记
我有这个html数据,我需要对其进行解析以从中提取数据。但它有太多的标记,数据对我来说也很难导航。从下面的html数据中,我需要创建一个python字典列表,如下所示: [{“学校”:“儿童” 播放“},{”地点“:“纽约”},{”关卡“:“四”},{”国家“:“美国”},{”关卡 当然“:“容易”}]Python 在</br>;使用beautifulsoup的标记,python,beautifulsoup,Python,Beautifulsoup,我有这个html数据,我需要对其进行解析以从中提取数据。但它有太多的标记,数据对我来说也很难导航。从下面的html数据中,我需要创建一个python字典列表,如下所示: [{“学校”:“儿童” 播放“},{”地点“:“纽约”},{”关卡“:“四”},{”国家“:“美国”},{”关卡 当然“:“容易”}] 学校孩子们的游戏 地点 级别四级 国家美国 课程水平轻松 我尝试使用beautifulsoup,但没有成功。请帮助不幸的是,HTML的构造并不适合解析,但可以将数据提取到有意义的Pytho
学校
孩子们的游戏
地点
级别
四级
国家
美国
课程水平
轻松
我尝试使用beautifulsoup,但没有成功。请帮助不幸的是,HTML的构造并不适合解析,但可以将数据提取到有意义的Python字典中
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(htmlString)
raw_data = soup.find(**{"class": "quick"}).contents
data = [x for x in raw_data if not hasattr(x, "name") or not x.name == "br"]
使用if not hasattr(x,“name”)或not x.name==“br”
首先检查项目是否是navigablesting
的实例,然后检查元素是否不是
标记
数据
将采用[,]
的格式,从中提取数据应该是相当简单的。不幸的是,HTML不是理想的解析格式,但是可以将数据提取到有意义的Python字典中
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(htmlString)
raw_data = soup.find(**{"class": "quick"}).contents
data = [x for x in raw_data if not hasattr(x, "name") or not x.name == "br"]
使用if not hasattr(x,“name”)或not x.name==“br”
首先检查项目是否是navigablesting
的实例,然后检查元素是否不是
标记
数据
将采用[,]
格式,从中提取数据应该非常简单