Stanford nlp 斯坦福大学NLP-VP vs NP

Stanford nlp 斯坦福大学NLP-VP vs NP,stanford-nlp,Stanford Nlp,我举了一个例子,斯坦福NLP为句子输出了一个奇怪的解析树: Clean my desk 如您所见,它将单词Clean标记为一个依赖于动词desk的形容词,整个短语标记为名词短语,而我的期望是Clean标记为动词,阶段标记为动词短语 JJ-PRP$-NN组合在英语中对我来说毫无意义。有人遇到过类似的事情吗?我知道斯坦福NLP的结果有时会根据解析工具运行的顺序(?)而有所不同。如何正确地制作这个标记?CoreNLP在这些命令式语句方面是出了名的糟糕。这个错误很可能是因为词性标记错误地将“clea

我举了一个例子,斯坦福NLP为句子输出了一个奇怪的解析树:

Clean my desk

如您所见,它将单词
Clean
标记为一个依赖于动词
desk
的形容词,整个短语标记为
名词短语
,而我的期望是
Clean
标记为动词,阶段标记为
动词短语


JJ-PRP$-NN组合在英语中对我来说毫无意义。有人遇到过类似的事情吗?我知道斯坦福NLP的结果有时会根据解析工具运行的顺序(?)而有所不同。如何正确地制作这个标记?

CoreNLP在这些命令式语句方面是出了名的糟糕。这个错误很可能是因为词性标记错误地将“clean”标记为形容词,尽管解析器似乎也犯了同样的错误。

如果您将句子
“clean my desk”
直接输入解析器(实际上是“tokenize”、“ssplit”和“parse”工具),它会给出以下结果:

(ROOT (NP (NP (NNP Clean)) (NP (PRP$ my) (NN desk))))
然而,现在
“Clean”
是一个专有名词——非常聪明,斯坦福。因此,如果我们在句子中输入第一个小写单词-
“清洁我的桌子”
,我们最终会得到我们想要的:

(ROOT (S (VP (VB clean) (NP (PRP$ my) (NN desk)))))

注意不要将整个句子转换成小写。在测试过程中,我注意到单词
“I”
变成了小写
“I”
被标记为FW(外来词),所以只将第一个单词转换成小写。

谢谢Gabor。我将尝试在不运行POS标记器的情况下运行解析器,看看这是否有什么不同。我也在尝试将我的句子小写。没有成功。我的句子:请求批准文档、查看或更改有关客户的详细信息、发布指定的预付款信息、查看或打印形式销售发票。
(ROOT (S (VP (VB clean) (NP (PRP$ my) (NN desk)))))