Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/email/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Email 如何识别人类发送的电子邮件?_Email_Imap_Email Spam_Imaplib_Email Headers - Fatal编程技术网

Email 如何识别人类发送的电子邮件?

Email 如何识别人类发送的电子邮件?,email,imap,email-spam,imaplib,email-headers,Email,Imap,Email Spam,Imaplib,Email Headers,我正在做一个项目,我需要识别真人发送的电子邮件,而不是批量邮件、通知和时事通讯。有什么明确的方法可以做到这一点吗?电子邮件标题中是否有任何有帮助的信息。我在Gmail IMAP上工作,所以我已经有了非垃圾邮件 在此方面的任何帮助都将不胜感激。谢谢 没有一个明确的方法来区分批量邮件和个性化邮件。与垃圾邮件不同的是,大多数批量邮件都是被请求/预期的,因此发件人不会做一些奇怪的事情来绕过垃圾邮件过滤器,这意味着这些邮件通常能很好地混合在一起 然而,你可以寻找一些趋势。如果你想做得可靠,你可能需要应用一

我正在做一个项目,我需要识别真人发送的电子邮件,而不是批量邮件、通知和时事通讯。有什么明确的方法可以做到这一点吗?电子邮件标题中是否有任何有帮助的信息。我在Gmail IMAP上工作,所以我已经有了非垃圾邮件


在此方面的任何帮助都将不胜感激。谢谢

没有一个明确的方法来区分批量邮件和个性化邮件。与垃圾邮件不同的是,大多数批量邮件都是被请求/预期的,因此发件人不会做一些奇怪的事情来绕过垃圾邮件过滤器,这意味着这些邮件通常能很好地混合在一起

然而,你可以寻找一些趋势。如果你想做得可靠,你可能需要应用一些评分系统,就像垃圾邮件过滤器一样

你还需要接受这样一个事实:你肯定会得到相当大比例的误报和漏报

批量邮件中常见的一些情况在个性化信件中出现的频率较低:

  • “收件人”和“抄送”地址不包含本地收件人。有时发件人会发送到“mailList@mydomain.com“而不是”recipientA@recipientAdomain.com", "recipientB@recipientBdomain.com在这些情况下,“收件人”中可能只显示一个地址,“抄送”中可能没有显示任何地址
  • “From”的地址是“noreply@”,“newsletter@”,“not reply@”,“mailinglist@”,甚至还有“support@”或“sales@”等不太常见的术语(但请记住,它们可能会导致误报)
  • 存在“”标头
  • 该邮件包含一个取消订阅链接。运行模式匹配以在电子邮件的最后几行中查找常见短语。查找链接,或“取消订阅”、“选择退出”等词语
  • 邮件列表往往有丰富的内容。检查是否大量使用CSS和大量图像,整个消息包含在
      结构中。i、 e.Dreamweaver之类的东西,而不是邮件客户端
    • 邮件顶部的标题或粗体内容。如果消息的第一部分类似于新闻稿,那么它可能就是新闻稿
    • 大量链接或频繁链接到相同(或相同的少数)网站。时事通讯将尽可能多地引导用户访问公司网站。如果链接域与(或类似)发件人域匹配,您可能会获得更高的分数
    • 大量引用社交媒体。如果是包含多篇文章的时事通讯,则每个故事可能都有自己的“Tweet this”、“Like this”链接。个人用户可能(最多)在签名中包含一个对Twitter、Facebook等的引用
    • 通知和其他自动生成的消息通常采用相同的基本格式。如果您有这些功能,请对以前的消息运行某种差异或其他比较。强大的匹配意味着自动化
    • 没有问候语,也没有一般的问候语。然而,个人电子邮件通常也会跳过“亲爱的弗雷德”的部分,因此这本身不是一个很好的检测;但像“亲爱的用户”或“亲爱的客户”这样的东西几乎肯定是通用的
    • 不太可能以“问候你,伊恩”或“你诚挚的,约翰·多伊”结尾
    • 发件人以前的得分很高。保持记录。如果发件人多次触发高分,几乎肯定是批量邮寄

    • 没有一种明确的方法来区分批量邮件和个性化邮件。与垃圾邮件不同的是,大多数批量邮件都是被请求/预期的,因此发件人不会做一些奇怪的事情来绕过垃圾邮件过滤器,这意味着这些邮件通常能很好地混合在一起

      然而,你可以寻找一些趋势。如果你想做得可靠,你可能需要应用一些评分系统,就像垃圾邮件过滤器一样

      你还需要接受这样一个事实:你肯定会得到相当大比例的误报和漏报

      批量邮件中常见的一些情况在个性化信件中出现的频率较低:

    • “收件人”和“抄送”地址不包含本地收件人。有时发件人会发送到“mailList@mydomain.com“而不是”recipientA@recipientAdomain.com", "recipientB@recipientBdomain.com在这些情况下,“收件人”中可能只显示一个地址,“抄送”中可能没有显示任何地址
    • “From”的地址是“noreply@”,“newsletter@”,“not reply@”,“mailinglist@”,甚至还有“support@”或“sales@”等不太常见的术语(但请记住,它们可能会导致误报)
    • 存在“”标头
    • 该邮件包含一个取消订阅链接。运行模式匹配以在电子邮件的最后几行中查找常见短语。查找链接,或“取消订阅”、“选择退出”等词语
    • 邮件列表往往有丰富的内容。检查是否大量使用CSS和大量图像,整个消息包含在
        结构中。i、 e.Dreamweaver之类的东西,而不是邮件客户端
      • 邮件顶部的标题或粗体内容。如果消息的第一部分类似于新闻稿,那么它可能就是新闻稿
      • 大量链接或频繁链接到相同(或相同的少数)网站。时事通讯将尽可能多地引导用户访问公司网站。如果链接域与(或类似)发件人域匹配,您可能会获得更高的分数
      • 大量引用社交媒体。如果是包含多篇文章的时事通讯,则每个故事可能都有自己的“Tweet this”、“Like this”链接。个人用户可能(最多)在签名中包含一个对Twitter、Facebook等的引用
      • 通知和其他自动生成的消息通常采用相同的基本格式。如果您有这些功能,请对以前的消息运行某种差异或其他比较。强大的matc