solr中带项向量分量的词干分析

solr中带项向量分量的词干分析,solr,stemming,Solr,Stemming,我在solr中使用术语向量组件来构建标记云。我还使用porter stem factory在索引和查询时进行词干分析 问题是术语向量在最终输出中以术语频率显示词干词。 示例:-如果我搜索“communication”一词,它会给我“commune”一词的频率,但我需要通信。我只需要词干分析,而不是术语向量。如何停止此操作?您可以创建一个没有词干分析的字段,并查询该字段以生成标记云 例如,假设您的当前字段名为my_text,则可能有如下内容: 首先定义一个新字段: <field name="

我在solr中使用术语向量组件来构建标记云。我还使用porter stem factory在索引和查询时进行词干分析

问题是术语向量在最终输出中以术语频率显示词干词。 示例:-如果我搜索“communication”一词,它会给我“commune”一词的频率,但我需要通信。我只需要词干分析,而不是术语向量。如何停止此操作?

您可以创建一个没有词干分析的字段,并查询该字段以生成标记云

例如,假设您的当前字段名为
my_text
,则可能有如下内容:

首先定义一个新字段:

<field name="my_text_2" type="my_text_type_2" indexed="true" stored="false" termVectors="true"/>

然后在写入时将文本复制到其中:

<copyField source="my_text" dest="my_text_2"/>

其中
my\u text\u type\u 2
是字段类型,您可以在其中设置所需的分析器。它可能是用于
my_text
的当前字段类型的副本,但没有词干