如何在python中使用imaplib获取电子邮件正文?

如何在python中使用imaplib获取电子邮件正文?,python,imaplib,Python,Imaplib,我想从IMAP4服务器获取整个消息。 在python文档中,如果您发现了以下代码: >>> t, data = M.fetch('1', '(RFC822)') >>> body = data[0][1] 我想知道我是否可以始终相信数据[0][1]返回邮件正文。当我运行“RFC822.SIZE”时,我得到的只是一个字符串而不是一个元组 我浏览了rfc1730,但无法找出“RFC822”的正确响应结构。从imaplib文档中也很难分辨提取结果结构 以下是获取R

我想从IMAP4服务器获取整个消息。 在python文档中,如果您发现了以下代码:

>>> t, data = M.fetch('1', '(RFC822)')
>>> body = data[0][1]
我想知道我是否可以始终相信数据[0][1]返回邮件正文。当我运行“RFC822.SIZE”时,我得到的只是一个字符串而不是一个元组

我浏览了rfc1730,但无法找出“RFC822”的正确响应结构。从imaplib文档中也很难分辨提取结果结构

以下是获取
RFC822
时得到的结果:

('OK', [('1 (RFC822 {858569}', 'body of the message', ')')])
但是当我获取
RFC822.SIZE
时,我得到:

('OK', ['1 (RFC822.SIZE 847403)'])
如何正确处理数据[0]列表? 我能相信当它是一个元组列表时,元组正好有3部分,第二部分是有效负载吗


也许你知道有更好的imap4库吗?

没有
imaplib
是一个非常好的库,它的imap非常难懂

您可能希望检查
t=='OK'
,但是
data[0][1]
在我使用过的数据中是否按预期工作

下面是一个快速示例,我使用它提取通过电子邮件收到的签名证书,它不是防爆的,但符合我的目的:

import getpass, os, imaplib, email
from OpenSSL.crypto import load_certificate, FILETYPE_PEM

def getMsgs(servername="myimapserverfqdn"):
  usernm = getpass.getuser()
  passwd = getpass.getpass()
  subject = 'Your SSL Certificate'
  conn = imaplib.IMAP4_SSL(servername)
  conn.login(usernm,passwd)
  conn.select('Inbox')
  typ, data = conn.search(None,'(UNSEEN SUBJECT "%s")' % subject)
  for num in data[0].split():
    typ, data = conn.fetch(num,'(RFC822)')
    msg = email.message_from_string(data[0][1])
    typ, data = conn.store(num,'-FLAGS','\\Seen')
    yield msg

def getAttachment(msg,check):
  for part in msg.walk():
    if part.get_content_type() == 'application/octet-stream':
      if check(part.get_filename()):
        return part.get_payload(decode=1)

if __name__ == '__main__':
  for msg in getMsgs():
    payload = getAttachment(msg,lambda x: x.endswith('.pem'))
    if not payload:
      continue
    try:
      cert = load_certificate(FILETYPE_PEM,payload)
    except:
      cert = None
    if cert:
      cn = cert.get_subject().commonName
      filename = "%s.pem" % cn
      if not os.path.exists(filename):
        open(filename,'w').write(payload)
        print "Writing to %s" % filename
      else:
        print "%s already exists" % filename
这个软件包比较容易使用。根据描述:

易于使用,肾盂和完整 IMAP客户端库


这是我提取有用信息的解决方案。到目前为止,它是可靠的:

import datetime
import email
import imaplib
import mailbox


EMAIL_ACCOUNT = "your@gmail.com"
PASSWORD = "your password"

mail = imaplib.IMAP4_SSL('imap.gmail.com')
mail.login(EMAIL_ACCOUNT, PASSWORD)
mail.list()
mail.select('inbox')
result, data = mail.uid('search', None, "UNSEEN") # (ALL/UNSEEN)
i = len(data[0].split())

for x in range(i):
    latest_email_uid = data[0].split()[x]
    result, email_data = mail.uid('fetch', latest_email_uid, '(RFC822)')
    # result, email_data = conn.store(num,'-FLAGS','\\Seen') 
    # this might work to set flag to seen, if it doesn't already
    raw_email = email_data[0][1]
    raw_email_string = raw_email.decode('utf-8')
    email_message = email.message_from_string(raw_email_string)

    # Header Details
    date_tuple = email.utils.parsedate_tz(email_message['Date'])
    if date_tuple:
        local_date = datetime.datetime.fromtimestamp(email.utils.mktime_tz(date_tuple))
        local_message_date = "%s" %(str(local_date.strftime("%a, %d %b %Y %H:%M:%S")))
    email_from = str(email.header.make_header(email.header.decode_header(email_message['From'])))
    email_to = str(email.header.make_header(email.header.decode_header(email_message['To'])))
    subject = str(email.header.make_header(email.header.decode_header(email_message['Subject'])))

    # Body details
    for part in email_message.walk():
        if part.get_content_type() == "text/plain":
            body = part.get_payload(decode=True)
            file_name = "email_" + str(x) + ".txt"
            output_file = open(file_name, 'w')
            output_file.write("From: %s\nTo: %s\nDate: %s\nSubject: %s\n\nBody: \n\n%s" %(email_from, email_to,local_message_date, subject, body.decode('utf-8')))
            output_file.close()
        else:
            continue
试试我的套餐:

例如:

from imap_tools import MailBox

# get list of email bodies from INBOX folder
with MailBox('imap.mail.com').login('test@mail.com', 'password', 'INBOX') as mailbox:
    bodies = [msg.text or msg.html for msg in mailbox.fetch()]
特点:

  • 解析的电子邮件属性
  • 用于搜索电子邮件的查询生成器
  • 处理文件夹中的电子邮件(复制、删除、标记、移动、查看、附加)
  • 使用邮箱文件夹(列表、设置、获取、创建、存在、重命名、删除、状态)
  • 无依赖项

很高兴知道这对你有用。但是你有没有想过为什么它会像上面描述的那样工作呢?返回值是标记化的IMAP服务器响应。可能更高级别的IMAP库需要处理不同IMAP实现之间的缺点,或者是不兼容的。我目前体验到,
数据[0]
实际上只是一个
字节
对象,而不是
元组(bytes,bytes)
。我的应用程序不断轮询来自IMAP服务器的新(未看到)消息,当我从web界面将消息标记为未读时,就会发生这种行为。服务位于。更具体地说,通常数据格式为
[(bytes,bytes),bytes]
但是,当手动将消息标记为未看到时,格式为
[字节,(字节,字节),字节]
如果我想阅读转发的电子邮件正文,该怎么办?我支持这一点。IMAPClient非常易于使用且面向对象。它比imaplib更易于使用,并且没有任何重大问题。不,使用
email\u from\u bytes
而不是希望将原始电子邮件正文转换为字符串不会产生意外的效果;额外的往返是不必要的,而且不管怎样,imap-tools非常容易使用