Python NLTK中的情感分析词典

Python NLTK中的情感分析词典,python,dictionary,nltk,Python,Dictionary,Nltk,我不熟悉python和NLTk。我在NLTK(NaivesBayesCalssifier)中创建了一个用于调查情绪分析的模型。为了提高准确性,我想在模型中添加一些包含肯定和否定语句列表的字典。NLTK中是否有任何模块,以及是否有任何其他功能可以改进我的模型?您可以查看一些公共情绪词汇,这些词汇将为您提供一个积极和消极词汇的语料库 其中一个可以在 由于您没有指定关于当前模型的任何细节,所以我假设您使用的是一个非常基本的朴素贝叶斯分类器。如果你现在使用单元格(单词)来矢量化你的文本,那么你可以考虑使

我不熟悉python和NLTk。我在NLTK(NaivesBayesCalssifier)中创建了一个用于调查情绪分析的模型。为了提高准确性,我想在模型中添加一些包含肯定和否定语句列表的字典。NLTK中是否有任何模块,以及是否有任何其他功能可以改进我的模型?

您可以查看一些公共情绪词汇,这些词汇将为您提供一个积极和消极词汇的语料库

其中一个可以在

由于您没有指定关于当前模型的任何细节,所以我假设您使用的是一个非常基本的朴素贝叶斯分类器。如果你现在使用单元格(单词)来矢量化你的文本,那么你可以考虑使用BigRAM或TrimRAMs来生成特征向量。这将基本上使你能够在一定程度上使用单词的上下文信息。

如果你现在使用一个类似TFIDF的单词包来转换你的文本,那么你可以考虑使用Word嵌入而不是那个。词包不考虑词语的上下文信息,而词嵌入则可以利用它。 你可以使用一些东西,比如gensim,它使用深度学习将单词转换成向量。看看:


此外,您可以尝试使用线性SVC分类器或逻辑回归分类器,并选择精度最高的分类器。

您可以查看一些公共情绪词汇,这些词汇将为您提供一个积极和消极词汇的语料库

其中一个可以在

由于您没有指定关于当前模型的任何细节,所以我假设您使用的是一个非常基本的朴素贝叶斯分类器。如果你现在使用单元格(单词)来矢量化你的文本,那么你可以考虑使用BigRAM或TrimRAMs来生成特征向量。这将基本上使你能够在一定程度上使用单词的上下文信息。

如果你现在使用一个类似TFIDF的单词包来转换你的文本,那么你可以考虑使用Word嵌入而不是那个。词包不考虑词语的上下文信息,而词嵌入则可以利用它。 你可以使用一些东西,比如gensim,它使用深度学习将单词转换成向量。看看:


此外,您可以尝试使用linearSVC分类器或logistic回归分类器,并选择精度最高的分类器。

您可以从NLTK下载一个分类器,如下所示:

from nltk.corpus import opinion_lexicon

pos_list=set(opinion_lexicon.positive())
neg_list=set(opinion_lexicon.negative())

您可以从NLTK下载一个,如下所示:

from nltk.corpus import opinion_lexicon

pos_list=set(opinion_lexicon.positive())
neg_list=set(opinion_lexicon.negative())

(1) 看看NLTK中有哪些模块。(2) 可能还有其他功能可以帮助您,但很难说,因为您没有指定当前使用的是什么。无论如何,功能工程不是一个编程问题,而是一个研究主题(因此它不属于so)。到目前为止,您的情绪分析模型使用了什么?(1)看看NLTK中有哪些模块。(2) 可能还有其他功能可以帮助您,但很难说,因为您没有指定当前使用的是什么。无论如何,特征工程不是一个编程问题,而是一个研究主题(因此它不属于so)。到目前为止,您的情绪分析模型使用了什么?