Email 如何以编程方式识别新闻稿

Email 如何以编程方式识别新闻稿,email,Email,电子邮件中是否有帮助识别新闻稿的标题? 我想将邮件分类为个人邮件、时事通讯、垃圾邮件和促销。 有没有代码可以做到这一点 我想要一个非机器学习的方法来解决这个问题。 轻量级内容分析就可以了。有各种各样的标题可以用来识别邮件列表,但总体而言,这个问题是一个启发式领域。以下是一些可以尝试的东西: 通用邮件列表软件包有自己的标题。即使它们不是明确的,您也可以相当快速地收集Majordomo、Listserv、Mailman、Yahoo Groups(bletch)等列表的集合,并找到典型的标题模式(如

电子邮件中是否有帮助识别新闻稿的标题? 我想将邮件分类为个人邮件、时事通讯、垃圾邮件和促销。 有没有代码可以做到这一点

我想要一个非机器学习的方法来解决这个问题。
轻量级内容分析就可以了。

有各种各样的标题可以用来识别邮件列表,但总体而言,这个问题是一个启发式领域。以下是一些可以尝试的东西:

  • 通用邮件列表软件包有自己的标题。即使它们不是明确的,您也可以相当快速地收集Majordomo、Listserv、Mailman、Yahoo Groups(bletch)等列表的集合,并找到典型的标题模式(如果没有标准化的话)
  • 常见和不常见的邮件列表越来越多地支持各种
    列表Xxx:
    标题。进一步看
  • 回到过去,许多邮件列表都会设置
    优先级:list
    。切向,另请参见
请注意,许多垃圾邮件发送者已经采用了部分或全部这些做法——讨厌的mainsleaze垃圾邮件发送者倾向于像业内其他人一样使用成熟的电子邮件软件;只是他们在邮件列表中加入的人的差别不大


如果只是为了帮助您构建决策树(并非所有的机器学习都是贝叶斯过滤,您知道!),我不会放弃机器学习方法。

代码可以做很多事情。但是您仍然需要告诉代码如何区分“垃圾邮件”和“火腿”。如果你说错了,它会把它分类错。我认为最优雅的解决方案是由。你给它很多“垃圾邮件”并说不好,然后你给它很多“火腿”并说好。如果你想看看它是如何工作的,它是开源的。希望能有帮助。我想用一种非机器学习的方法来回答这个问题。你必须在问题中详细说明这一点。还有,为什么?我唯一能告诉你的是,我认识的几乎每个客户都使用学习方法,因为硬过滤器根本不起作用。如果你坚持的话,你可能会把一些正则表达式拼凑起来,但是开发起来会很痛苦,而且只能工作一半的时间。