Nlp 在哪里可以找到详尽的停止词列表?

Nlp 在哪里可以找到详尽的停止词列表?,nlp,lexical-analysis,stop-words,Nlp,Lexical Analysis,Stop Words,我在哪里可以找到详尽的停止词列表?我有一个很短,似乎不适用于科学文本。 我正在创建词汇链,从科学论文中提取关键主题。问题是,诸如基于、关于等词也应该被视为停止词,因为它们没有太多意义。很难找到一个完整的停止词列表,因为一个给定的词可以在给定的域中被视为停止词,但在另一个域中却是一个重要的词 您可以查看一些停止词列表: 您还可以轻松添加到现有的停止词列表中。例如,使用NLTK工具包中的一个: from nltk.corpus import stopwords 然后添加您认为缺少的内容: s

我在哪里可以找到详尽的停止词列表?我有一个很短,似乎不适用于科学文本。
我正在创建词汇链,从科学论文中提取关键主题。问题是,诸如基于、
关于
等词也应该被视为停止词,因为它们没有太多意义。

很难找到一个完整的停止词列表,因为一个给定的词可以在给定的域中被视为停止词,但在另一个域中却是一个重要的词

您可以查看一些停止词列表:


您还可以轻松添加到现有的停止词列表中。例如,使用NLTK工具包中的一个:

from nltk.corpus import stopwords
然后添加您认为缺少的内容:

stopwords = stopwords.words('english')+["based", "regarding"]

原始NLTK列表已被描述。

在这种情况下,检查某些特定于域的词典可能更重要?(我使用WordNet)。。。我是NLP的新手