Machine learning 确定电子邮件地址是邮件列表地址还是个人电子邮件地址

Machine learning 确定电子邮件地址是邮件列表地址还是个人电子邮件地址,machine-learning,dataset,data-mining,Machine Learning,Dataset,Data Mining,现在我正在构建一个功能来确定电子邮件地址是邮件列表地址/组邮件地址还是个人电子邮件地址。我目前的策略是使用人工注释,然后这些数据用于确定传入的邮件地址。示例recruitment@stackoverflow.com,是邮寄地址,因此我存储此电子邮件地址的名称招聘,并标记为组,因此将来如果收到名为招聘的电子邮件,我将忽略它。您是否有任何其他解决方案来构建此功能,而不使用带有手动注释的数据集?任何帮助都将不胜感激将域名作为一项功能使用可能是有意义的,或者两者都使用。毕竟,很多邮件列表都是公司的,很多

现在我正在构建一个功能来确定电子邮件地址是邮件列表地址/组邮件地址还是个人电子邮件地址。我目前的策略是使用人工注释,然后这些数据用于确定传入的邮件地址。示例<代码>recruitment@stackoverflow.com,是邮寄地址,因此我存储此电子邮件地址的名称
招聘
,并标记为组,因此将来如果收到名为
招聘
的电子邮件,我将忽略它。您是否有任何其他解决方案来构建此功能,而不使用带有手动注释的数据集?任何帮助都将不胜感激

将域名作为一项功能使用可能是有意义的,或者两者都使用。毕竟,很多邮件列表都是公司的,很多个人地址都来自雅虎、Gmail等网站。拥有附加功能可以为您提供更多数据,从而创建一个学习算法来对邮件进行分类,例如Perceptron()。这种方法仍然需要手动更新,但它将使您的功能随着时间的推移变得更加智能