Java 如何使用Lucene对字符串应用小写
我开始使用ApacheLucene8.0。我想知道如何使用Lucene将我的Java 如何使用Lucene对字符串应用小写,java,lucene,tokenize,lowercase,Java,Lucene,Tokenize,Lowercase,我开始使用ApacheLucene8.0。我想知道如何使用Lucene将我的字符串文本变量转换为小写。我真的不知道怎么做,因为我找不到任何例子。我想要的是这样的东西: public class DocumentLowercase { private Analyzer analyzer; public Analyzer DocAnalysis(Document d) { analyzer = new StandardAnalyzer(); String text = d.t
字符串文本
变量转换为小写。我真的不知道怎么做,因为我找不到任何例子。我想要的是这样的东西:
public class DocumentLowercase {
private Analyzer analyzer;
public Analyzer DocAnalysis(Document d) {
analyzer = new StandardAnalyzer();
String text = d.text();
**Here convert String Text into lowercase**
** maybe using Lower Case Tokenizer? but how? **
return analyzer;
}
}
StandardAnalyzer已经将所有内容转换为小写 检查此处的文档: 他们说: 使用 可配置的停止词列表 您还可以在源代码中看到StandardAnalyzer包括哪些组件:
@Override
protected TokenStreamComponents createComponents(final String fieldName) {
final StandardTokenizer src = new StandardTokenizer();
src.setMaxTokenLength(maxTokenLength);
TokenStream tok = new LowerCaseFilter(src);
tok = new StopFilter(tok, stopwords);
return new TokenStreamComponents(r -> {
src.setMaxTokenLength(StandardAnalyzer.this.maxTokenLength);
src.setReader(r);
}, tok);
}
如果您想自定义分析器,您应该查看CustomAnalyzer