Java 如何在语料库中投射WordNet单词的结果

Java 如何在语料库中投射WordNet单词的结果,java,netbeans-7,wordnet,Java,Netbeans 7,Wordnet,实际上,我的问题是,我想从文档中提取给出wordnet结果的单词,以便只提取文档中存在的单词。但结果仍然是空的,我想这是因为文字的格式不同 如何更改文档中的单词的基本形式 例如,如果我有“car”这个词,我会通过wordnet找到它的超非线性词,那么我只保留文档中找到的词,我应该如何做到这一点?斯坦福大学有一个用Java编写的lemmatizer,我实际上在我的信息检索课程中使用过它,但它不能立即运行。您可以,我建议您在使用之前阅读文档 现在你所要做的就是在索引之前把单词输入柠檬加工程序。简化为

实际上,我的问题是,我想从文档中提取给出wordnet结果的单词,以便只提取文档中存在的单词。但结果仍然是空的,我想这是因为文字的格式不同

如何更改文档中的单词的基本形式


例如,如果我有“car”这个词,我会通过wordnet找到它的超非线性词,那么我只保留文档中找到的词,我应该如何做到这一点?

斯坦福大学有一个用Java编写的lemmatizer,我实际上在我的信息检索课程中使用过它,但它不能立即运行。您可以,我建议您在使用之前阅读文档


现在你所要做的就是在索引之前把单词输入柠檬加工程序。简化为相同引理(词根形式)的单词应该在词典中的同一位置建立索引。

首先,你认为你的答案很正确,但我仍然不清楚。我不知道你有没有把我的问题讲清楚。我想知道如何在文档上投影wordNet结果(是字符串格式)。以查找wordNet结果中的哪些单词存在于文档中。我将在java中操作它class@Hela一个单词可能有数百个超字母缩略词。如果您试图在语料库中搜索所有这些内容,程序将运行缓慢。在构建语料库的同时,对单词进行语法化,然后对搜索词进行语法化。这样,您只需搜索一个术语。这也是现代信息检索系统使用反向索引的原因。在反向索引中,属于同一引理的两个单词将索引到同一位置。WordNet只使用一个单词,并扩展到多个结果。您需要将许多结果简化为一个单词(正好相反)。基于这个原因,我建议使用柠檬汁机。是的,我现在不想尝试你的建议,我会试试的。此外,你是否知道如何从Wordnet中提取部分关系并从中引出原因:我有两个概念,我不想知道它们之间的关系,我可以用Wordnet来解决。还有,你知道怎么做吗??提前谢谢你的回答。我想问一个新的问题,特别是关于这个话题的。在发帖前一定要阅读“如何提问”指南,以避免获得大量的反对票。