Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/typescript/8.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Lucene演示中的Stopwords和词干_Lucene_Stop Words_Stemming - Fatal编程技术网

Lucene演示中的Stopwords和词干

Lucene演示中的Stopwords和词干,lucene,stop-words,stemming,Lucene,Stop Words,Stemming,关于Lucene演示,我有两个主要问题。Lucene演示是否在任何修改之前使用stopwords? 堵住怎么办?如果是这样,它使用什么样的词干分析器?您指的是哪个演示 如果是,那么答案是: (a) 停止单词:不,它没有。它使用StandardAnalyzer(),在创建时不使用停止词(但如果您选择提供一些参数,它可以) (b) 词干分析:不,它不使用词干分析-演示代码中没有涉及词干分析类,因为标准分析器没有使用词干分析 请看一看javadoc,了解最新版本。您将看到以下内容: 使用可配置的停止字

关于Lucene演示,我有两个主要问题。Lucene演示是否在任何修改之前使用stopwords?
堵住怎么办?如果是这样,它使用什么样的词干分析器?

您指的是哪个演示

如果是,那么答案是:

(a) 停止单词:不,它没有。它使用
StandardAnalyzer()
,在创建时不使用停止词(但如果您选择提供一些参数,它可以)

(b) 词干分析:不,它不使用词干分析-演示代码中没有涉及词干分析类,因为标准分析器没有使用词干分析

请看一看javadoc,了解最新版本。您将看到以下内容:

使用可配置的停止字列表,使用小写字母filter和StopFilter筛选标准标记器

因此,这将告诉您如何分析输入文档:

  • 使用,您可以阅读的规则

  • 使用-它的工作原理与您预期的一样

  • 使用-您可能提供了也可能没有提供任何停止词


我是说Lucene 8.7.0演示版。我在回答中链接的演示版是“官方”Lucene 8.7.0演示版-因此我假设您指的就是这个。目前,所有Lucene文档链接似乎都已断开-如下所示(这是演示的源代码)。