如何使用python转换html数据

如何使用python转换html数据,python,extract,Python,Extract,我正在寻找一条建议,因为我是python的新手 假设我有多个数据块,类似于下面的一个: aaa bbb ccc 有时br的数量会有所不同,并非所有块都是恒定的 我的目的是将td块内部的数据提取到文件中,但我仍然停留在这里 这里的正则表达式是最好的方法吗 提前感谢。使用类似BeautifulSoup的HTML解析器解析HTML(pip安装beautifulsoup4): 从bs4导入美化组 html=”“” aaabbbccc """ soup=BeautifulSoup(html) 对于汤中

我正在寻找一条建议,因为我是python的新手

假设我有多个数据块,类似于下面的一个:



aaa
bbb
ccc

有时br的数量会有所不同,并非所有块都是恒定的

我的目的是将td块内部的数据提取到文件中,但我仍然停留在这里

这里的正则表达式是最好的方法吗


提前感谢。

使用类似BeautifulSoup的HTML解析器解析HTML(
pip安装beautifulsoup4
):

从bs4导入美化组
html=”“”

aaa
bbb
ccc """ soup=BeautifulSoup(html) 对于汤中的td。查找所有('td'): 打印(td.get_text())
结果是:

 some title  aaa bbb ccc

使用类似BeautifulSoup的HTML解析器解析HTML(
pip安装beautifulsoup4
):

从bs4导入美化组
html=”“”

aaa
bbb
ccc """ soup=BeautifulSoup(html) 对于汤中的td。查找所有('td'): 打印(td.get_text())
结果是:

 some title  aaa bbb ccc

如果您正在处理大量这些数据块,则BeautifulSoup可能适合您的需要。如果您正在处理大量这些数据块,则BeautifulSoup可能适合您的需要。