Python 如何简单地将mhtml文件转换为html文件

Python 如何简单地将mhtml文件转换为html文件,python,html,parsing,mhtml,Python,Html,Parsing,Mhtml,我试图通过使用BeautifulSoup4从html文件中获取一个简单的数据。 但是当我遇到mthml文件时,我遇到了一个问题。html解析器在mhtml文件中不工作。 所以,我需要将mhtml文件转换为简单的html文件。或者通过其他东西加载mhtml文件,bcuz的主要目的只是提取一个数据 有人可以通过使用python来帮助实现这一点吗? (我已经知道我可以通过使用MS Word轻松地转换它…但我想通过自动进行python编程来实现这一点)github上有一个repo,名为,值得一看。代码是

我试图通过使用BeautifulSoup4从html文件中获取一个简单的数据。 但是当我遇到mthml文件时,我遇到了一个问题。html解析器在mhtml文件中不工作。 所以,我需要将mhtml文件转换为简单的html文件。或者通过其他东西加载mhtml文件,bcuz的主要目的只是提取一个数据

有人可以通过使用python来帮助实现这一点吗?
(我已经知道我可以通过使用MS Word轻松地转换它…但我想通过自动进行python编程来实现这一点)

github上有一个repo,名为,值得一看。代码是Python2编写的,可读性强,注释良好。虽然这是一项正在进行的工作,但仍然可以是一个很好的起点。

到目前为止,您做了哪些尝试?你能发布一些代码吗?你能给我一些提示吗?我是python程序的一员,如果你只是想得到一个提示,那么在快速搜索的基础上,一个MHTML文件被格式化为一个MIME html电子邮件,所以我想象你会首先解析它,提取它的html部分(维基百科说它通常是标题后的第二部分),然后用bs4解析html部分。