Python 解析电子邮件中的HTML内容

Python 解析电子邮件中的HTML内容,python,email,parsing,imap,imaplib,Python,Email,Parsing,Imap,Imaplib,我正试图编写一个python脚本来阅读我的电子邮件。 我能够正确地获取大部分内容,如到,从,主题。 但是在正文中,我得到了文本以及它的HTML代码,如下所示 下面是从电子邮件中提取内容的代码部分 email_message = email.message_from_string(raw_email) print 'To:', email_message['To'] print 'Sent from:', email_message['From'] print 'Date:', email_me

我正试图编写一个python脚本来阅读我的电子邮件。 我能够正确地获取大部分内容,如
主题
。 但是在
正文
中,我得到了文本以及它的HTML代码,如下所示

下面是从电子邮件中提取内容的代码部分

email_message = email.message_from_string(raw_email)
print 'To:', email_message['To']
print 'Sent from:', email_message['From']
print 'Date:', email_message['Date']
print 'Subject:', email_message['Subject']
print '*'*30, 'MESSAGE', '*'*30
maintype = email_message.get_content_maintype()
#print maintype

if maintype == 'multipart':
    for part in email_message.get_payload():
            if part.get_content_maintype() == 'text':
                print part.get_payload()
elif maintype == 'text':
    print email_message.get_payload()
print '*'*69
完整代码的Git链接:


如何摆脱HTML代码而只获取纯文本?

消息体是MIME编码的-这就是为什么它同时包含纯文本和HTML格式的文本。为了获得正文的纯文本,您首先需要对消息进行MIME解码。您可以使用python进行MIME解码。另外,有关更多信息,请参阅。

那么您有什么问题@对不起,我忘记提了。现在编辑