Dependencies 带标点或不带标点的依赖项解析器计算_Dependencies_Nlp_Stanford Nlp

Dependencies 带标点或不带标点的依赖项解析器计算

dependencies nlp stanford-nlp

Dependencies 带标点或不带标点的依赖项解析器计算,dependencies,nlp,stanford-nlp,Dependencies,Nlp,Stanford Nlp,我想评估一个依赖关系解析器，考虑标点符号而不是标点符号。如果我不想考虑标点符号，我应该如何定义输入数据？如果我使用相同的输入数据（带有标点符号的普通句子）作为输入，解析器将定义包括标点符号在内的所有依赖项。在评估过程中，我排除了与句号和逗号等相关的所有依赖项，还是应该删除输入句子中的标点符号？为什么在评估依赖项解析器时经常不包括标点符号（CONLL-X）无论评估细节如何，输入数据的定义都应相同。在标准CoNLL评估中，我们只是不计算指向标点符号的弧。（“标准评估中的标点符号是``.，：（）

我想评估一个依赖关系解析器，考虑标点符号而不是标点符号。如果我不想考虑标点符号，我应该如何定义输入数据？如果我使用相同的输入数据（带有标点符号的普通句子）作为输入，解析器将定义包括标点符号在内的所有依赖项。在评估过程中，我排除了与句号和逗号等相关的所有依赖项，还是应该删除输入句子中的标点符号？

为什么在评估依赖项解析器时经常不包括标点符号（CONLL-X）

无论评估细节如何，输入数据的定义都应相同。在标准CoNLL评估中，我们只是不计算指向标点符号的弧。（“标准评估中的标点符号是

``.，：

（））

至于“为什么”，我没有一个非常令人满意的答案。。以下是一些猜测：

SOTA解析器不太擅长确定标点依赖关系（true）。如果加上标点符号，数字会大幅下降。自然语言分析的真正改进可能会被标点符号性能的变化所掩盖，这是不可取的

标点依赖性有点难以维护，我认为*——当前数据集中现存的只是一种惯例，但其他标点分析也可能获得许可。（将其与例如

amod

依赖项进行比较，考虑到我们在注释方案上达成一致，这一点是无可争议的。）

`*我不是依赖语法方面的专家，所以请不要对我太认真：）