Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/387.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java Lucene 4.1.0 Porter茎秆分析器工作不正常_Java_Algorithm_Lucene_Porter Stemmer - Fatal编程技术网

Java Lucene 4.1.0 Porter茎秆分析器工作不正常

Java Lucene 4.1.0 Porter茎秆分析器工作不正常,java,algorithm,lucene,porter-stemmer,Java,Algorithm,Lucene,Porter Stemmer,我在Java中使用我的应用程序,我使用Lucene 4.1.0使用Porter Stemmer方法。 我已经阅读并实施了 这是我的密码 import org.apache.lucene.analysis.snowball.*; import org.tartarus.snowball.ext.PorterStemmer; private String stemmer(String word){ PorterStemmer obj = new PorterStemmer();

我在Java中使用我的应用程序,我使用Lucene 4.1.0使用Porter Stemmer方法。 我已经阅读并实施了

这是我的密码

import org.apache.lucene.analysis.snowball.*;
import org.tartarus.snowball.ext.PorterStemmer;


 private String stemmer(String word){
        PorterStemmer obj = new PorterStemmer();
        obj.setCurrent(word);
        obj.stem();
        return obj.getCurrent();
}
此方法有效,但Porter Stemmer对某些词无效,例如:

  • 来源>>来源
  • 耦合>>耦合
  • 伴奏>>伴奏
  • 也许算法中有错误?
    如何解决这个问题呢?

    波特干扰物算法有望将源代码转换成sourc。请阅读

    中有关porter stemmer算法的更多信息。您可以在porter stemmer的顶部使用word suggester。对于单词建议,您可以使用“suggester basic in java”

    这正是porter算法的工作原理,您希望得到什么?如何解决该错误?也许有什么解决办法?谢谢,对不起,我当时不明白波特·斯泰默的意思。那些完全正确的输出谢谢你的回答,有什么办法可以解决这个问题吗?你到底想用词干法实现什么?总会有一些词干过度的情况。也许你正在尝试实现的是柠檬化。词干分析的主要目的是将单词的不同形式映射到单个形式,这就是波特算法所做的。所以它不是一个bug。但是柠檬化要实现起来更复杂。我在我的应用程序中使用WordNet,我想从文本中设置一个关键字作为WordNet的输入。所以,我需要一个单词的单一形式