Nlp 在大文件中对否定词和肯定词进行分类?

Nlp 在大文件中对否定词和肯定词进行分类?,nlp,nltk,sentiment-analysis,wordnet,senti-wordnet,Nlp,Nltk,Sentiment Analysis,Wordnet,Senti Wordnet,我试图得到一个非常大的文件中的正负计数。我只需要一个原始的方法(不需要花费时间)。我试过sentiwordnet,但总是得到一个索引器:列表索引超出范围,我想这是因为wordnet字典中没有列出这些单词。文本包含大量的拼写错误和“非单词” 如果有人能给我任何建议,我将不胜感激 这完全取决于您的数据是什么样的,以及任务的最终目标是什么。您需要对您的项目进行更详细的描述,但一般来说,以下是您的选择: -制作你自己的情绪分析词典:我真的怀疑这是你想要做的,因为这需要很多时间和精力,但如果你的数据足够简

我试图得到一个非常大的文件中的正负计数。我只需要一个原始的方法(不需要花费时间)。我试过sentiwordnet,但总是得到一个
索引器:列表索引超出范围
,我想这是因为wordnet字典中没有列出这些单词。文本包含大量的拼写错误和“非单词”


如果有人能给我任何建议,我将不胜感激

这完全取决于您的数据是什么样的,以及任务的最终目标是什么。您需要对您的项目进行更详细的描述,但一般来说,以下是您的选择: -制作你自己的情绪分析词典:我真的怀疑这是你想要做的,因为这需要很多时间和精力,但如果你的数据足够简单,它是可行的。 -清理您的数据:如果您的令牌不在senti wordnet中,因为有太多的噪音和拼写错误的单词,那么在通过wordnet之前尝试更正它们,这至少会限制您将遇到的错误数量。 -使用senti wordnet替代方案:虽然没有那么多好的,但是如果您使用的是python(从错误的外观来看,您似乎是python),您可以随时尝试。 -只对你能做的分类:这是我的建议。如果单词不在senti wordnet中,则转到下一个。只需捕获错误(
try:…除indexer:pass之外
),并通过计算实际捕获的情绪词来推断数据的总体情绪

PS:我们需要查看您的代码才能确定,但我认为您获得索引器还有另一个原因。如果单词不在senti wordnet中,您将得到一个keyrerror,但这也取决于您如何编写函数

祝你好运,我希望这对你有帮助