Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/entity-framework/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Dependencies 带标点或不带标点的依赖项解析器计算_Dependencies_Nlp_Stanford Nlp - Fatal编程技术网

Dependencies 带标点或不带标点的依赖项解析器计算

Dependencies 带标点或不带标点的依赖项解析器计算,dependencies,nlp,stanford-nlp,Dependencies,Nlp,Stanford Nlp,我想评估一个依赖关系解析器,考虑标点符号而不是标点符号。如果我不想考虑标点符号,我应该如何定义输入数据?如果我使用相同的输入数据(带有标点符号的普通句子)作为输入,解析器将定义包括标点符号在内的所有依赖项。在评估过程中,我排除了与句号和逗号等相关的所有依赖项,还是应该删除输入句子中的标点符号? 为什么在评估依赖项解析器时经常不包括标点符号(CONLL-X) 无论评估细节如何,输入数据的定义都应相同。 在标准CoNLL评估中,我们只是不计算指向标点符号的弧。(“标准评估中的标点符号是``.,:()

我想评估一个依赖关系解析器,考虑标点符号而不是标点符号。如果我不想考虑标点符号,我应该如何定义输入数据?如果我使用相同的输入数据(带有标点符号的普通句子)作为输入,解析器将定义包括标点符号在内的所有依赖项。在评估过程中,我排除了与句号和逗号等相关的所有依赖项,还是应该删除输入句子中的标点符号?
为什么在评估依赖项解析器时经常不包括标点符号(CONLL-X)

无论评估细节如何,输入数据的定义都应相同。 在标准CoNLL评估中,我们只是不计算指向标点符号的弧。(“标准评估中的标点符号是
``.,:
())

至于“为什么”,我没有一个非常令人满意的答案。。以下是一些猜测:

  • SOTA解析器不太擅长确定标点依赖关系(true)。如果加上标点符号,数字会大幅下降。自然语言分析的真正改进可能会被标点符号性能的变化所掩盖,这是不可取的
  • 标点依赖性有点难以维护,我认为*——当前数据集中现存的只是一种惯例,但其他标点分析也可能获得许可。(将其与例如
    amod
    依赖项进行比较,考虑到我们在注释方案上达成一致,这一点是无可争议的。)
  • `*我不是依赖语法方面的专家,所以请不要对我太认真:)