Python NLTK朴素贝叶斯分类器问题

Python NLTK朴素贝叶斯分类器问题,python,nltk,text-classification,naivebayes,Python,Nltk,Text Classification,Naivebayes,我正在试验NaiveBayesClassifier,并有以下培训数据: positive_vocab = [ 'awesome' ] negative_vocab = [ 'bad'] neutral_vocab = [ 'so-so' ] ... classifier = NaiveBayesClassifier.train(train_set) 然后我将以下句子分类:糟糕的电影,我喜欢它 以下是我从每个单词中得到的信息: 坏:阴性 真棒:pos 电影,:pos i:位置 喜欢:pos i

我正在试验NaiveBayesClassifier,并有以下培训数据:

positive_vocab = [ 'awesome' ]
negative_vocab = [ 'bad']
neutral_vocab = [ 'so-so' ]
...
classifier = NaiveBayesClassifier.train(train_set) 
然后我将以下句子分类:糟糕的电影,我喜欢它

以下是我从每个单词中得到的信息:

坏:阴性 真棒:pos 电影,:pos i:位置 喜欢:pos it:pos

如何/为什么决定将不在培训集中的单词(如我喜欢它,电影)归类为积极单词


谢谢

训练情绪模型意味着您的模型可以学习单词如何影响情绪因此,这不是关于指定哪些词是肯定的,哪些词是否定的,而是关于如何训练您的模型,使其能够从文本本身理解这一点

最简单的实现称为“单词包”(通常与TF-IDF规范化一起使用)。单词包是这样工作的:你把你的文本按单词分割,并计算每个单词在给定文本块(或评论)中出现的次数。这样,行对应于不同的评论,列对应于给定评论中给定单词的出现次数。此表将成为您的
X
,要预测的目标情绪将成为您的
Y
(0表示负面,1表示正面)

然后训练分类器:

训练模型后,您可以进行预测:

new_reviews = your_load_function2()
new_X = vectorizer.transform(new_reviews)
predicted_Y = model.predict(new_X)
进一步阅读:




谢谢。这个方法怎么样:?看起来那个家伙不明白他在做什么。他的代码中有很多错误。我建议你通过这个问题来了解NLTK的NaiveBayesClassifier是如何工作的
new_reviews = your_load_function2()
new_X = vectorizer.transform(new_reviews)
predicted_Y = model.predict(new_X)