Java 如何使用Lucene对字符串应用小写_Java_Lucene_Tokenize_Lowercase

Java 如何使用Lucene对字符串应用小写

java lucene

Java 如何使用Lucene对字符串应用小写,java,lucene,tokenize,lowercase,Java,Lucene,Tokenize,Lowercase,我开始使用ApacheLucene8.0。我想知道如何使用Lucene将我的字符串文本变量转换为小写。我真的不知道怎么做，因为我找不到任何例子。我想要的是这样的东西： public class DocumentLowercase { private Analyzer analyzer; public Analyzer DocAnalysis(Document d) { analyzer = new StandardAnalyzer(); String text = d.t

我开始使用ApacheLucene8.0。我想知道如何使用Lucene将我的

字符串文本

变量转换为小写。我真的不知道怎么做，因为我找不到任何例子。我想要的是这样的东西：

public class DocumentLowercase {

private Analyzer analyzer; 

public Analyzer DocAnalysis(Document d) {

    analyzer = new StandardAnalyzer();
    String text = d.text();

    **Here convert String Text into lowercase**
    ** maybe using Lower Case Tokenizer? but how? **        

    return analyzer;


}
}

StandardAnalyzer已经将所有内容转换为小写

检查此处的文档：

他们说：

使用可配置的停止词列表

您还可以在源代码中看到StandardAnalyzer包括哪些组件：

  @Override
  protected TokenStreamComponents createComponents(final String fieldName) {
    final StandardTokenizer src = new StandardTokenizer();
    src.setMaxTokenLength(maxTokenLength);
    TokenStream tok = new LowerCaseFilter(src);
    tok = new StopFilter(tok, stopwords);
    return new TokenStreamComponents(r -> {
      src.setMaxTokenLength(StandardAnalyzer.this.maxTokenLength);
      src.setReader(r);
    }, tok);
  }

如果您想自定义分析器，您应该查看

CustomAnalyzer