如何将电子邮件解析为有意义的内容(尤其是文本/html部分)?-python/pop3
嗯。这是我的密码:如何将电子邮件解析为有意义的内容(尤其是文本/html部分)?-python/pop3,python,email,html-email,pop3,Python,Email,Html Email,Pop3,嗯。这是我的密码: hotmail = poplib.POP3_SSL("pop3.live.com", 995) hotmail.user("username") hotmail.pass_("password") mail_1= hotmail.retr(1) message_1 = email.message_from_string("\n".join(mail_1[1])) for part in message.walk(): print part.get_conte
hotmail = poplib.POP3_SSL("pop3.live.com", 995)
hotmail.user("username")
hotmail.pass_("password")
mail_1= hotmail.retr(1)
message_1 = email.message_from_string("\n".join(mail_1[1]))
for part in message.walk():
print part.get_content_type()
print "\n"
print part.get_payload()
print "----------------------------------------------"
mail_2 = hotmail.retr(2)
message_2 = email.message_from_string("\n".join(mail_2[1]))
for part in message.walk():
print part.get_content_type()
print "\n"
print part.get_payload()
print "----------------------------------------------"
我现在遇到的问题是,对于hotmail欢迎邮件mail\u 1
,一切正常,尤其是text/html
部分,格式正确。但是对于mail_2
这是一条多部分/可选的
消息,我从text/html
中得到的是一团混乱,到处都是像=0D
和3D
和=
这样的填充物,一些典型的行是这样的:
<td id=3D"middle_column=
_content_cell" style=3D"background-color:#ffffff;=0D
-webkit-border-radius:6=
px; -moz-border-radius:6px; border-radius:6px;=0D
-webkit-box-shadow:0 1p=
x 3px rgba(0,0,0, 0.2);=0D
-moz-box-shadow:0 1px 3=
px rgba(0,0,0, 0.2);=0D
box-shadow:0 1px 3px rg=
ba(0,0,0, 0.2);">=0D
=0D
<span style=3D"font=
-family:'Helvetica Neue', Helvetica, Arial, sans-serif;=0D
font-size:16px; lin=
e-height:22px; color:#424242;">=0D
=0D
=0D
=0D
那么,我该怎么做才能获得有意义的文本/html
消息正文?您想要模块:
有文字部分吗?大多数HTML电子邮件也有一个单独的纯文本部分,您应该能够直接阅读。您是否看过文档中的
get\u payload
?
import quopri
decoded_text = quopri.decodestring(encoded_text)