Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/solr/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Solr-合并方面中的类似术语?_Solr_Collation_Facet - Fatal编程技术网

Solr-合并方面中的类似术语?

Solr-合并方面中的类似术语?,solr,collation,facet,Solr,Collation,Facet,我正在使用Solr的facet功能检索文档中最频繁的索引,我想知道是否有可能将类似术语的频率“合并”在一起(例如,借助levenshtein距离) 例如,考虑: “沟通技巧”出现200次,“沟通技巧”出现100次,是否可能让Solr返回“沟通技巧:300次” 谢谢你的帮助 Solr在插入的内容上创建面。因此,如果您插入沟通技巧和沟通技巧,它将无法理解是否要将其合并 但是,您可以使用同义词过滤器工厂,其中必须定义沟通技巧是文件中沟通技巧的同义词,Solr将用沟通技巧替换沟通技巧 编辑 您还可以使用

我正在使用Solr的facet功能检索文档中最频繁的索引,我想知道是否有可能将类似术语的频率“合并”在一起(例如,借助levenshtein距离)

例如,考虑: “沟通技巧”出现200次,“沟通技巧”出现100次,是否可能让Solr返回“沟通技巧:300次”


谢谢你的帮助

Solr在插入的内容上创建面。因此,如果您插入
沟通技巧
沟通技巧
,它将无法理解是否要将其合并

但是,您可以使用
同义词过滤器工厂
,其中必须定义
沟通技巧
是文件中
沟通技巧
的同义词,Solr将用
沟通技巧
替换
沟通技巧

编辑


您还可以使用
PorterStemFilterFactory
对单词进行词干处理,但是,这对单个标记有效,因此这意味着要分解标记,然后进行词干处理,然后以某种方式将它们连接回来。由于词干的存在,这也会产生不利影响。

谢谢朱奈德的回答:)但是我无意事先知道这些“同义词”。有没有一种方法可以让Solr动态计算“同义词”?我能让Solr明白,如果[word 1]和[word 2]的levenhstein距离为