Python 3.x 使用nltk对文本进行分类

Python 3.x 使用nltk对文本进行分类,python-3.x,nlp,nltk,Python 3.x,Nlp,Nltk,我是NLP概念的新手。我需要将收件箱中的邮件分类为账单、健康、广告等。我计划使用nltk分类并阅读nltk.classify.naivebayes是一个不错的选择。我从哪里开始?谁能给我一个简单的示例代码。我看过很多解释朴素贝叶斯及其算法的帖子 首先,如前所述,您应该对数据进行注释。这意味着为收件箱中已有的电子邮件分配标签(如账单、健康状况)。 之后,您必须对其进行规范化,这意味着将其拆分为标记,并将所有单词转换为小写 要开始处理数据,必须在字典中将其表示为向量 这里还有一个很好的例子,我觉得很

我是NLP概念的新手。我需要将收件箱中的邮件分类为账单、健康、广告等。我计划使用nltk分类并阅读nltk.classify.naivebayes是一个不错的选择。我从哪里开始?谁能给我一个简单的示例代码。我看过很多解释朴素贝叶斯及其算法的帖子

首先,如前所述,您应该对数据进行注释。这意味着为收件箱中已有的电子邮件分配标签(如账单、健康状况)。 之后,您必须对其进行规范化,这意味着将其拆分为标记,并将所有单词转换为小写

要开始处理数据,必须在字典中将其表示为向量


这里还有一个很好的例子,我觉得很有用

第一步是对数据进行注释。第二步(甚至第一步)是阅读NLTK书中关于分类的章节。@JosepValls我如何对数据进行注释?你能提供一个示例代码吗?不要编写你自己的朴素贝叶斯分类器(这就是本教程的目的)。使用nltk提供的一个。