Nlp 是否有一个句子词性标注正确,但单词成分错误?

Nlp 是否有一个句子词性标注正确,但单词成分错误?,nlp,stanford-nlp,pos-tagger,Nlp,Stanford Nlp,Pos Tagger,我是自然语言处理的初学者,我正在阅读有关词性标记和成分的书籍。我遇到过这样的情况:句子的成分是正确的,但词性标注是错误的 我使用了斯坦福解析器 例如,“Madam,我是Adam”将Madam作为副词生成,该副词不正确,但成分正确。 我在寻找一个词性标注正确但成分错误的句子。 上述条件是否适用于任何句子?是。POS标签的组成结构可能是正确的,也可能是错误的 他们在草地上玩耍 词性标注和成分是: (ROOT (S (NP (PRP They)) (VP (VBD played)

我是自然语言处理的初学者,我正在阅读有关词性标记和成分的书籍。我遇到过这样的情况:句子的成分是正确的,但词性标注是错误的

我使用了斯坦福解析器

例如,“Madam,我是Adam”将Madam作为副词生成,该副词不正确,但成分正确。

我在寻找一个词性标注正确但成分错误的句子。
上述条件是否适用于任何句子?

是。POS标签的组成结构可能是正确的,也可能是错误的

他们在草地上玩耍

词性标注和成分是:

(ROOT
  (S
    (NP (PRP They))
    (VP (VBD played)
      (PP (IN in)
        (NP (DT the) (NN ground)))
      (PP (IN with)
        (NP (NN grass) (NN turf))))))
也就是说,“他们在草地上玩耍。”。 但原来的组织结构应该是,

(ROOT
  (S
    (NP (PRP They))
    (VP (VBD played)
      (PP (IN in)
        (NP (DT the) (NN ground))
            (PP (IN with)
              (NP (NN grass) (NN turf)))))))
理想情况下,这意味着“他们在有草皮的场地上比赛”

在第一个句子成分中,草皮限定了“他们玩过”,在第二个成分中,草皮限定了地面,这在语义上是恰当的含义


这个句子有点模棱两可,没有逗号。但是它在语法和语义上都是正确的。

因为有不同的方法将给定的字符串划分为越来越小的子字符串,所以毫不奇怪,给定字符串的正确词性标记可能会被分配到不正确的组成结构

@sherlock给出的例子是一种句法歧义的情况,其中一种意思比另一种更可取。这种情况的另一个例子是第(1)句中咨询委员会成员的名词短语

(1) 咨询委员会成员被要求不要向新闻界发表讲话

根据对所讨论的名词短语最自然的解释,形容词advisory修饰名词committee,这意味着咨询和委员会组成的结构比委员会和成员组成的结构更可取。(委员会和成员应构成一个组成部分的一个例子是名词短语“委员会成员”。)

给出一个你所询问的不涉及句法歧义的多个例子中的一个,考虑(2)中的句子。

(2) 他们想让他读这本书


根据转换语法理论,他在(2)应该是嵌入的不定式从句的一部分,而不是动词的直接宾语;假设这一点的一个原因是,他在(2)中从动词read中获得了一个主题角色。可以想象,解析器会为(2)中的单词指定正确的pos,但会为(2)中的单词指定一个不正确的结构,其中him是所需的直接对象。增加这种错误可能性的一个因素是,如果我们将(2)中的通缉犯替换为被告,那么正确的结构就是被告直接被告知的对象,因为在他们让他阅读这本书时,被告给了他一个主题角色。

哈哈,这很有趣OP回答了他自己的有趣问题=)是的。当我问这个问题时,我想要答案。但我自己找到了答案,因此更新了它。