Solr-合并方面中的类似术语?
我正在使用Solr的facet功能检索文档中最频繁的索引,我想知道是否有可能将类似术语的频率“合并”在一起(例如,借助levenshtein距离) 例如,考虑: “沟通技巧”出现200次,“沟通技巧”出现100次,是否可能让Solr返回“沟通技巧:300次”Solr-合并方面中的类似术语?,solr,collation,facet,Solr,Collation,Facet,我正在使用Solr的facet功能检索文档中最频繁的索引,我想知道是否有可能将类似术语的频率“合并”在一起(例如,借助levenshtein距离) 例如,考虑: “沟通技巧”出现200次,“沟通技巧”出现100次,是否可能让Solr返回“沟通技巧:300次” 谢谢你的帮助 Solr在插入的内容上创建面。因此,如果您插入沟通技巧和沟通技巧,它将无法理解是否要将其合并 但是,您可以使用同义词过滤器工厂,其中必须定义沟通技巧是文件中沟通技巧的同义词,Solr将用沟通技巧替换沟通技巧 编辑 您还可以使用
谢谢你的帮助 Solr在插入的内容上创建面。因此,如果您插入
沟通技巧
和沟通技巧
,它将无法理解是否要将其合并
但是,您可以使用同义词过滤器工厂
,其中必须定义沟通技巧
是文件中沟通技巧
的同义词,Solr将用沟通技巧
替换沟通技巧
编辑
您还可以使用
PorterStemFilterFactory
对单词进行词干处理,但是,这对单个标记有效,因此这意味着要分解标记,然后进行词干处理,然后以某种方式将它们连接回来。由于词干的存在,这也会产生不利影响。谢谢朱奈德的回答:)但是我无意事先知道这些“同义词”。有没有一种方法可以让Solr动态计算“同义词”?我能让Solr明白,如果[word 1]和[word 2]的levenhstein距离为