如何在python中使用imaplib获取电子邮件正文?
我想从IMAP4服务器获取整个消息。 在python文档中,如果您发现了以下代码:如何在python中使用imaplib获取电子邮件正文?,python,imaplib,Python,Imaplib,我想从IMAP4服务器获取整个消息。 在python文档中,如果您发现了以下代码: >>> t, data = M.fetch('1', '(RFC822)') >>> body = data[0][1] 我想知道我是否可以始终相信数据[0][1]返回邮件正文。当我运行“RFC822.SIZE”时,我得到的只是一个字符串而不是一个元组 我浏览了rfc1730,但无法找出“RFC822”的正确响应结构。从imaplib文档中也很难分辨提取结果结构 以下是获取R
>>> t, data = M.fetch('1', '(RFC822)')
>>> body = data[0][1]
我想知道我是否可以始终相信数据[0][1]返回邮件正文。当我运行“RFC822.SIZE”时,我得到的只是一个字符串而不是一个元组
我浏览了rfc1730,但无法找出“RFC822”的正确响应结构。从imaplib文档中也很难分辨提取结果结构
以下是获取RFC822
时得到的结果:
('OK', [('1 (RFC822 {858569}', 'body of the message', ')')])
但是当我获取RFC822.SIZE
时,我得到:
('OK', ['1 (RFC822.SIZE 847403)'])
如何正确处理数据[0]列表?
我能相信当它是一个元组列表时,元组正好有3部分,第二部分是有效负载吗
也许你知道有更好的imap4库吗?没有
imaplib
是一个非常好的库,它的imap非常难懂
您可能希望检查t=='OK'
,但是data[0][1]
在我使用过的数据中是否按预期工作
下面是一个快速示例,我使用它提取通过电子邮件收到的签名证书,它不是防爆的,但符合我的目的:
import getpass, os, imaplib, email
from OpenSSL.crypto import load_certificate, FILETYPE_PEM
def getMsgs(servername="myimapserverfqdn"):
usernm = getpass.getuser()
passwd = getpass.getpass()
subject = 'Your SSL Certificate'
conn = imaplib.IMAP4_SSL(servername)
conn.login(usernm,passwd)
conn.select('Inbox')
typ, data = conn.search(None,'(UNSEEN SUBJECT "%s")' % subject)
for num in data[0].split():
typ, data = conn.fetch(num,'(RFC822)')
msg = email.message_from_string(data[0][1])
typ, data = conn.store(num,'-FLAGS','\\Seen')
yield msg
def getAttachment(msg,check):
for part in msg.walk():
if part.get_content_type() == 'application/octet-stream':
if check(part.get_filename()):
return part.get_payload(decode=1)
if __name__ == '__main__':
for msg in getMsgs():
payload = getAttachment(msg,lambda x: x.endswith('.pem'))
if not payload:
continue
try:
cert = load_certificate(FILETYPE_PEM,payload)
except:
cert = None
if cert:
cn = cert.get_subject().commonName
filename = "%s.pem" % cn
if not os.path.exists(filename):
open(filename,'w').write(payload)
print "Writing to %s" % filename
else:
print "%s already exists" % filename
这个软件包比较容易使用。根据描述:
易于使用,肾盂和完整
IMAP客户端库
这是我提取有用信息的解决方案。到目前为止,它是可靠的:
import datetime
import email
import imaplib
import mailbox
EMAIL_ACCOUNT = "your@gmail.com"
PASSWORD = "your password"
mail = imaplib.IMAP4_SSL('imap.gmail.com')
mail.login(EMAIL_ACCOUNT, PASSWORD)
mail.list()
mail.select('inbox')
result, data = mail.uid('search', None, "UNSEEN") # (ALL/UNSEEN)
i = len(data[0].split())
for x in range(i):
latest_email_uid = data[0].split()[x]
result, email_data = mail.uid('fetch', latest_email_uid, '(RFC822)')
# result, email_data = conn.store(num,'-FLAGS','\\Seen')
# this might work to set flag to seen, if it doesn't already
raw_email = email_data[0][1]
raw_email_string = raw_email.decode('utf-8')
email_message = email.message_from_string(raw_email_string)
# Header Details
date_tuple = email.utils.parsedate_tz(email_message['Date'])
if date_tuple:
local_date = datetime.datetime.fromtimestamp(email.utils.mktime_tz(date_tuple))
local_message_date = "%s" %(str(local_date.strftime("%a, %d %b %Y %H:%M:%S")))
email_from = str(email.header.make_header(email.header.decode_header(email_message['From'])))
email_to = str(email.header.make_header(email.header.decode_header(email_message['To'])))
subject = str(email.header.make_header(email.header.decode_header(email_message['Subject'])))
# Body details
for part in email_message.walk():
if part.get_content_type() == "text/plain":
body = part.get_payload(decode=True)
file_name = "email_" + str(x) + ".txt"
output_file = open(file_name, 'w')
output_file.write("From: %s\nTo: %s\nDate: %s\nSubject: %s\n\nBody: \n\n%s" %(email_from, email_to,local_message_date, subject, body.decode('utf-8')))
output_file.close()
else:
continue
试试我的套餐:
例如:
from imap_tools import MailBox
# get list of email bodies from INBOX folder
with MailBox('imap.mail.com').login('test@mail.com', 'password', 'INBOX') as mailbox:
bodies = [msg.text or msg.html for msg in mailbox.fetch()]
特点:
- 解析的电子邮件属性
- 用于搜索电子邮件的查询生成器
- 处理文件夹中的电子邮件(复制、删除、标记、移动、查看、附加)
- 使用邮箱文件夹(列表、设置、获取、创建、存在、重命名、删除、状态)
- 无依赖项
数据[0]
实际上只是一个字节
对象,而不是元组(bytes,bytes)
。我的应用程序不断轮询来自IMAP服务器的新(未看到)消息,当我从web界面将消息标记为未读时,就会发生这种行为。服务位于。更具体地说,通常数据格式为[(bytes,bytes),bytes]
但是,当手动将消息标记为未看到时,格式为[字节,(字节,字节),字节]
如果我想阅读转发的电子邮件正文,该怎么办?我支持这一点。IMAPClient非常易于使用且面向对象。它比imaplib更易于使用,并且没有任何重大问题。不,使用email\u from\u bytes
而不是希望将原始电子邮件正文转换为字符串不会产生意外的效果;额外的往返是不必要的,而且不管怎样,imap-tools非常容易使用