Solr-俄语同义词不起作用
我在ubuntu 12.04 LTS上安装了solr v4.8.0 我在schema.xml中有filter solr.SynonymFilterFactory字段Solr-俄语同义词不起作用,solr,Solr,我在ubuntu 12.04 LTS上安装了solr v4.8.0 我在schema.xml中有filter solr.SynonymFilterFactory字段 <fieldType name="text_ru" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="solr.StandardTokenizerFactory"/>
<fieldType name="text_ru" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/stopwords_ru.txt" format="snowball" />
<filter class="solr.SnowballPorterFilterFactory" language="Russian"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true" />
</analyzer>
</fieldType>
我检查了“synonyms.txt”文件的编码,它是utf-8
使用英语同义词的查询工作正常。我只对俄语同义词有问题,它们不起作用,索尔忽略了它们。我自己解决不了这个问题
30分钟后由我添加:
不知何故,搜索结果中可以找到“ббббббббббббббббббббббббббб。当我禁用它时,一切工作都很顺利,还可以用同义词help替换它
参考测试-尝试交换同义词和波特过滤器的顺序。实际上,在切掉单词的词尾后,您正在查找同义词文件。可能只是不匹配
admin Web UI中的分析屏幕是一个很好的工具,可以查看文本通过各个过滤器时会发生什么情况。从
solr
中是否有其他信息,如调试输出?能否在schema.xml中向我们展示完整的字段定义?因此,“ббббббббббббббб,“аааааааааааааааааааааааааааааааа107。
spidermen, superman, batman, бетмен, бетмэн, спайдермен, спайдермэн, супермен, супермэн, spiderman