Nlp 利用上下文改进词性标注

Nlp 利用上下文改进词性标注,nlp,Nlp,是否有一些常用的或推荐的技术来使用单词的上下文来提高词性标注的准确性 例如,如果我有一句话: 我在高尔夫球场打高尔夫球 “链接”一词可以是单数(高尔夫球场)也可以是复数。我在几个语法检查中试过这个句子,他们都正确地识别出这个句子是有效的 问题是他们还认为这句话是正确的: 我点击了一个链接 有没有一个好方法可以利用上下文(点击与打高尔夫球)来推断正确的词性 谢谢 确定“链接”是“高尔夫球场”还是“参考资料”是一项称为词义消歧的任务。 以下是维基百科关于词性标注的文章: 在任何真实的测试中,词性标注

是否有一些常用的或推荐的技术来使用单词的上下文来提高词性标注的准确性

例如,如果我有一句话:

我在高尔夫球场打高尔夫球

“链接”一词可以是单数(高尔夫球场)也可以是复数。我在几个语法检查中试过这个句子,他们都正确地识别出这个句子是有效的

问题是他们还认为这句话是正确的:

我点击了一个链接

有没有一个好方法可以利用上下文(点击与打高尔夫球)来推断正确的词性

谢谢

确定“链接”是“高尔夫球场”还是“参考资料”是一项称为词义消歧的任务。 以下是维基百科关于词性标注的文章:

在任何真实的测试中,词性标注和意义标注都是密切相关的,二者都可能相互制约。这些任务是保持在一起还是分离的问题仍然没有得到一致的解决,但最近科学家倾向于分别测试这些东西(例如,在感官/半感官竞赛中,词类被提供作为文本消歧的输入)。 将词义消歧问题与词性标注问题进行比较具有指导意义。这两种方法都涉及到消除歧义或用词标记,无论是用词义还是词性。然而,用于其中一个词的算法不适用于另一个词,这主要是因为一个词的词性主要取决于与三个词相邻的一个词,而一个词的词义可能取决于距离更远的词。目前,词性标注算法的成功率远高于WSD,目前的技术水平约为95%或更高,相比之下,监督学习词义消歧的准确率不到75%。这些数字是英语的典型数字,可能与其他语言的数字大不相同

我不知道有哪些作品使用WSD通知词性标注(然而,使用词性标注通知WSD是标准)。这对我来说是个好主意,即使对准确性的好处很小,因为准确性已经很高了。它可以作为Toutanova的CRF标记器中的一个功能实现