Stanford CorenNLP短语词性标记和柠檬化解释

Stanford CorenNLP短语词性标记和柠檬化解释,nlp,stanford-nlp,Nlp,Stanford Nlp,我在短语的柠檬化过程中得到了这个结果: 收集的需求 使用、词性标记和该短语的柠檬化结果: 出于某种原因,“collected”被赋予一个词性标签“JJ”(“形容词”),这可能导致引理被“collected”而不是“collected” 如果输入短语为“收集的需求”(即小写),则POS标记被正确识别为动词,并且柠檬化结果与我预期的一致: 为什么CoreNLP将collected识别为形容词而不是动词?当您编写“collected requirements”时,系统会检查单词“collected

我在短语的柠檬化过程中得到了这个结果:

收集的需求

使用、词性标记和该短语的柠檬化结果:

出于某种原因,“collected”被赋予一个词性标签“JJ”(“形容词”),这可能导致引理被“collected”而不是“collected”

如果输入短语为“收集的需求”
(即小写),则POS标记被正确识别为动词,并且柠檬化结果与我预期的一致:


为什么CoreNLP将
collected
识别为形容词而不是动词?

当您编写“collected requirements”时,系统会检查单词“collected”的词性标记出现的可能性。只有一些单词,如命名实体、句子开头等,以大写字母开头。当你用大写字母开头时,“collected”更可能是JJ的一般原因是,它在句首主要用作形容词而不是动词

据我所知,
collect
及其过去式
collected
都是动词。我想不出任何英语句子中
collect
collected
是一个形容词。你可以吗?“收集的文档被存放在办公室”,这是一个用于描述需求的形容词。在短语“收集的文档被存放在办公室”中,
collected
是一个过去分词动词,用作形容词,斯坦福NLP将其识别为过去分词动词(VBN而不是JJ,引理仍然是
collect
)。所以,我仍然没有看到任何斯坦福NLP会识别为JJ的例子。是的,CoreNLP将所有用作形容词的过去分词动词识别为VBN。唯一的反例就是你找到的那个。我能想到的唯一原因是,在coreNLP培训所用的语料库中,有一个标记为“JJNNS”的“收集的需求”。在这种情况下,我认为CorenNLP是错误的。