法语网站上的多术语同义词不适用于Solr
使用Drupal 7.39和Solr 3.5(搜索Api模块)对法语站点进行搜索,搜索的关键字按要求工作,它使用搜索的关键字返回所需的记录 但是,在使用多术语同义词时,搜索结果不能正常工作。下面是synonyms_fr.txt文件的一些内容 负责任的资源人类,负责任的RH 资源咨询公司Humaines、资源咨询公司RH、资源咨询公司 胡梅内斯,康塞勒RH 右开发总监,右开发总监 人力资源总监 雇员和补偿 项目总监、项目总监、保留负责人, 保留经理 在搜索“负责任的RH”或“负责任的资源Humaines”时,solr返回正确的数据。但使用“右侧开发总监”返回“X”个数字或记录,但使用它的值“人力资源开发总监”返回0个记录,“员工和公司管理总监”返回“X-1”个记录 无法理解为什么长期会议不起作用 下面是法国站点的solr配置法语网站上的多术语同义词不适用于Solr,solr,Solr,使用Drupal 7.39和Solr 3.5(搜索Api模块)对法语站点进行搜索,搜索的关键字按要求工作,它使用搜索的关键字返回所需的记录 但是,在使用多术语同义词时,搜索结果不能正常工作。下面是synonyms_fr.txt文件的一些内容 负责任的资源人类,负责任的RH 资源咨询公司Humaines、资源咨询公司RH、资源咨询公司 胡梅内斯,康塞勒RH 右开发总监,右开发总监 人力资源总监 雇员和补偿 项目总监、项目总监、保留负责人, 保留经理 在搜索“负责任的RH”或“负责任的资源Humai
<fieldType name="text_fr" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt" />
<tokenizer class="solr.WhitespaceTokenizerFactory" />
<filter class="solr.StopFilterFactory" words="stopwords_fr.txt" format="snowball" ignoreCase="true" enablePositionIncrements="true" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnCaseChange="1" splitOnNumerics="1" catenateWords="1" catenateNumbers="1" catenateAll="0" protected="protwords.txt" preserveOriginal="1" />
<filter class="solr.SynonymFilterFactory" synonyms="synonyms_fr.txt" ignoreCase="true" expand="true" />
<filter class="solr.FrenchLightStemFilterFactory" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
<analyzer type="query">
<charFilter class="solr.MappingCharFilterFactory" mapping="mapping-ISOLatin1Accent.txt" />
<tokenizer class="solr.WhitespaceTokenizerFactory" />
<filter class="solr.StopFilterFactory" words="stopwords_fr.txt" format="snowball" ignoreCase="true" enablePositionIncrements="true" />
<filter class="solr.LowerCaseFilterFactory" />
<filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" splitOnCaseChange="1" splitOnNumerics="1" catenateWords="0" catenateNumbers="0" catenateAll="0" protected="protwords.txt" preserveOriginal="1" />
<filter class="solr.FrenchLightStemFilterFactory" />
<filter class="solr.RemoveDuplicatesTokenFilterFactory" />
</analyzer>
多术语同义词很复杂,效果不太好。 我正在使用 而且效果很好 但是,如果您向我们提供您正在搜索的不同单词的分析结果,您可以首先对您的配置进行更多的调查。 此外,当你说“Responsable RH”时,你是指短语查询还是强调文本中的示例?是的,“Responsable RH”是短语查询。