Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/logging/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在Java中从树库标记转换为wordnet兼容的标记?_Java_Nlp - Fatal编程技术网

在Java中从树库标记转换为wordnet兼容的标记?

在Java中从树库标记转换为wordnet兼容的标记?,java,nlp,Java,Nlp,我有来自OpenNLP的POS标记输入…我需要将这些用于WordNet…但是WordNet只使用4个标记-名词、动词、形容词、副词…OpenNLP根据这些标记生成标记。我需要将它们转换为wordnet兼容的标签。。。我确实在这个网站上找到了——但都是python。我需要java 同意我可以自己编写一个简单的函数来重命名这些标记。但是如何处理其他标记,如DT、PP、PDT、POS、MD等。关于您希望如何处理WordNet关联的更多信息可能会有所帮助,但我的第一个猜测是,你想丢弃那些不能清晰地映射到

我有来自OpenNLP的POS标记输入…我需要将这些用于WordNet…但是WordNet只使用4个标记-名词、动词、形容词、副词…OpenNLP根据这些标记生成标记。我需要将它们转换为wordnet兼容的标签。。。我确实在这个网站上找到了——但都是python。我需要java


同意我可以自己编写一个简单的函数来重命名这些标记。但是如何处理其他标记,如DT、PP、PDT、POS、MD等。

关于您希望如何处理WordNet关联的更多信息可能会有所帮助,但我的第一个猜测是,你想丢弃那些不能清晰地映射到WordNet类别的词类

例如,考虑DT(确定器)。你是否希望从WordNet获得“the”和“an”之间的关系?类似地,在WordNet中,PP(介词)可能有一些有用的关系,但我怀疑你更可能在不同的名词或动词之间找到有用的关系,而不是封闭类单词之间的关系

我的建议是首先将每个树库词性标记映射到一个WordNet类,或者对于没有明显映射的词性标记映射到“null”(您可能在某处找到这样的映射,但只有36个标记,您自己也可以轻松地进行映射)


对于封闭类单词,您可能会决定使用另一个关系元数据源,但这可能取决于应用程序的最终目标。

我在问题中已经说了所有这些。当然,我可以手动映射,然后为其编写函数……但如果影响我的应用程序,不会吗?我正在尝试从wordnet提取语法集??在使用映射功能后,我将对具有空标记的单词执行什么操作??我将如何处理这些非wordnet标记??这是主要的问题…你的申请是什么?从WordNet中提取语法集通常不是最终目标。例如,您希望为“an”找到哪种映射?我不是WordNet方面的专家,但我不希望找到“an”、“the”、“of”等反义词的同义词。同义词和反义词的概念对封闭类单词没有多大意义。