Python 标点符号删除前后的词性标注?

Python 标点符号删除前后的词性标注?,python,nlp,nltk,Python,Nlp,Nltk,关于NLP最佳实践的一个可能非常基本的问题 标点符号是否会影响NLTK词类标记器的行为?或者在将句子传递给词性标注者之前删除句子中的标点符号可以吗?通常标点符号在词性标注之前与单词标记分离。标点符号有其自身的正字法作用,这与周围的单词标记不同 例如,标记这个句子:名词动词 For PREP example N , , tokenize V this PRON sentence N : : Noun N verbs V

关于NLP最佳实践的一个可能非常基本的问题


标点符号是否会影响NLTK词类标记器的行为?或者在将句子传递给词性标注者之前删除句子中的标点符号可以吗?

通常标点符号在词性标注之前与单词标记分离。标点符号有其自身的正字法作用,这与周围的单词标记不同

例如,标记这个句子:名词动词

For       PREP
example   N
,         ,
tokenize  V
this      PRON
sentence  N
:         :
Noun      N
verbs     V
.         .

是否将标点符号保留到该阶段取决于您的最终目标。对于语法标记,标点符号确实具有语法作用,删除标点符号通常会降低分析的质量。对于情绪分析,标点符号通常不会造成任何极性(尽管大量刘海可能会传达强调或强极性!!!!!!!)

标点符号通常在词性标记之前与单词标记分离。标点符号有其自身的正字法作用,这与周围的单词标记不同

例如,标记这个句子:名词动词

For       PREP
example   N
,         ,
tokenize  V
this      PRON
sentence  N
:         :
Noun      N
verbs     V
.         .

是否将标点符号保留到该阶段取决于您的最终目标。对于语法标记,标点符号确实具有语法作用,删除标点符号通常会降低分析的质量。对于情绪分析,标点符号通常不会造成任何极性(尽管大量刘海可能会传达强调或强极性!!!)

也许可以看看?这本笔记本是一个伟大的研究,谢谢!也许你可以看看?这个笔记本是一个伟大的研究,谢谢!我的应用程序(目前)是实现用于关键字提取/汇总的textrank。所以我想我可以不用标点符号。。。谢谢我的应用程序(目前)是实现用于关键字提取/汇总的textrank。所以我想我可以不用标点符号。。。谢谢