Email 如何以编程方式识别新闻稿
电子邮件中是否有帮助识别新闻稿的标题? 我想将邮件分类为个人邮件、时事通讯、垃圾邮件和促销。 有没有代码可以做到这一点 我想要一个非机器学习的方法来解决这个问题。Email 如何以编程方式识别新闻稿,email,Email,电子邮件中是否有帮助识别新闻稿的标题? 我想将邮件分类为个人邮件、时事通讯、垃圾邮件和促销。 有没有代码可以做到这一点 我想要一个非机器学习的方法来解决这个问题。 轻量级内容分析就可以了。有各种各样的标题可以用来识别邮件列表,但总体而言,这个问题是一个启发式领域。以下是一些可以尝试的东西: 通用邮件列表软件包有自己的标题。即使它们不是明确的,您也可以相当快速地收集Majordomo、Listserv、Mailman、Yahoo Groups(bletch)等列表的集合,并找到典型的标题模式(如
轻量级内容分析就可以了。有各种各样的标题可以用来识别邮件列表,但总体而言,这个问题是一个启发式领域。以下是一些可以尝试的东西:
- 通用邮件列表软件包有自己的标题。即使它们不是明确的,您也可以相当快速地收集Majordomo、Listserv、Mailman、Yahoo Groups(bletch)等列表的集合,并找到典型的标题模式(如果没有标准化的话)
- 常见和不常见的邮件列表越来越多地支持各种
标题。进一步看列表Xxx:
- 回到过去,许多邮件列表都会设置
。切向,另请参见优先级:list
如果只是为了帮助您构建决策树(并非所有的机器学习都是贝叶斯过滤,您知道!),我不会放弃机器学习方法。代码可以做很多事情。但是您仍然需要告诉代码如何区分“垃圾邮件”和“火腿”。如果你说错了,它会把它分类错。我认为最优雅的解决方案是由。你给它很多“垃圾邮件”并说不好,然后你给它很多“火腿”并说好。如果你想看看它是如何工作的,它是开源的。希望能有帮助。我想用一种非机器学习的方法来回答这个问题。你必须在问题中详细说明这一点。还有,为什么?我唯一能告诉你的是,我认识的几乎每个客户都使用学习方法,因为硬过滤器根本不起作用。如果你坚持的话,你可能会把一些正则表达式拼凑起来,但是开发起来会很痛苦,而且只能工作一半的时间。