Nlp 在大文件中对否定词和肯定词进行分类？_Nlp_Nltk_Sentiment Analysis_Wordnet_Senti Wordnet

Nlp 在大文件中对否定词和肯定词进行分类？

nlp

Nlp 在大文件中对否定词和肯定词进行分类？,nlp,nltk,sentiment-analysis,wordnet,senti-wordnet,Nlp,Nltk,Sentiment Analysis,Wordnet,Senti Wordnet,我试图得到一个非常大的文件中的正负计数。我只需要一个原始的方法（不需要花费时间）。我试过sentiwordnet，但总是得到一个索引器：列表索引超出范围，我想这是因为wordnet字典中没有列出这些单词。文本包含大量的拼写错误和“非单词” 如果有人能给我任何建议，我将不胜感激这完全取决于您的数据是什么样的，以及任务的最终目标是什么。您需要对您的项目进行更详细的描述，但一般来说，以下是您的选择： -制作你自己的情绪分析词典：我真的怀疑这是你想要做的，因为这需要很多时间和精力，但如果你的数据足够简

我试图得到一个非常大的文件中的正负计数。我只需要一个原始的方法（不需要花费时间）。我试过sentiwordnet，但总是得到一个

索引器：列表索引超出范围

，我想这是因为wordnet字典中没有列出这些单词。文本包含大量的拼写错误和“非单词”

如果有人能给我任何建议，我将不胜感激

这完全取决于您的数据是什么样的，以及任务的最终目标是什么。您需要对您的项目进行更详细的描述，但一般来说，以下是您的选择： -制作你自己的情绪分析词典：我真的怀疑这是你想要做的，因为这需要很多时间和精力，但如果你的数据足够简单，它是可行的。 -清理您的数据：如果您的令牌不在senti wordnet中，因为有太多的噪音和拼写错误的单词，那么在通过wordnet之前尝试更正它们，这至少会限制您将遇到的错误数量。 -使用senti wordnet替代方案：虽然没有那么多好的，但是如果您使用的是python（从错误的外观来看，您似乎是python），您可以随时尝试。 -只对你能做的分类：这是我的建议。如果单词不在senti wordnet中，则转到下一个。只需捕获错误（

try:…除indexer:pass之外

），并通过计算实际捕获的情绪词来推断数据的总体情绪

PS：我们需要查看您的代码才能确定，但我认为您获得索引器还有另一个原因。如果单词不在senti wordnet中，您将得到一个keyrerror，但这也取决于您如何编写函数

祝你好运，我希望这对你有帮助