Configuration 与Solr Suggester一起使用多个词典
我正在使用Suggester组件进行自动完成。我想提供各种类型的建议,例如地点、公司名称、产品和字典单词 这些列表的大小和波动性各不相同,因此将它们保存在同一个文本文件中不是最方便的 我使用文本文件是因为我希望能够为建议的术语添加权重 可以使用多个文本文件吗?我尝试了以下方法:Configuration 与Solr Suggester一起使用多个词典,configuration,solr,autocomplete,Configuration,Solr,Autocomplete,我正在使用Suggester组件进行自动完成。我想提供各种类型的建议,例如地点、公司名称、产品和字典单词 这些列表的大小和波动性各不相同,因此将它们保存在同一个文本文件中不是最方便的 我使用文本文件是因为我希望能够为建议的术语添加权重 可以使用多个文本文件吗?我尝试了以下方法: <!-- WFSTLookup suggest component --> <searchComponent class="solr.SpellCheckComponent" name="suggest
<!-- WFSTLookup suggest component -->
<searchComponent class="solr.SpellCheckComponent" name="suggestword">
<lst name="spellchecker">
<str name="name">suggestword</str>
<str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
<str name="lookupImpl">org.apache.solr.spelling.suggest.fst.WFSTLookupFactory</str>
<str name="storeDir">suggestword</str>
<str name="buildOnCommit">false</str>
<!-- Suggester properties -->
<bool name="exactMatchFirst">true</bool>
<str name="sourceLocation">../data/words.txt</str>
<str name="sourceLocation">../data/cities.txt</str>
</lst>
暗示性词语
org.apache.solr.spelling.Suggester
org.apache.solr.spelling.suggest.fst.wfstlookupffactory
暗示性词语
假的
真的
../data/words.txt
../data/cities.txt
但是第二个列表,城市,在重新启动tomcat并重建字典之后,显然没有被发现。这能做到吗?如果没有,您建议如何管理不同的词典?有关SOLR 5.2,请参阅 在solrconfig.xml中,使用相应的源文件定义多个建议词典,例如:
<searchComponent name="suggest" class="solr.SuggestComponent">
<lst name="suggester">
<str name="name">words_suggester</str>
<str name="lookupImpl">FuzzyLookupFactory</str>
<str name="dictionaryImpl">FileDictionaryFactory</str>
<str name="sourceLocation">words.txt</str>
<str name="storeDir">words_dict</str>
<str name="suggestAnalyzerFieldType">string</str>
</lst>
<lst name="suggester">
<str name="name">cities_suggester</str>
<str name="lookupImpl">FuzzyLookupFactory</str>
<str name="dictionaryImpl">FileDictionaryFactory</str>
<str name="sourceLocation">cities.txt</str>
<str name="storeDir">cities_dict</str>
<str name="suggestAnalyzerFieldType">string</str>
</lst>
...
</searchComponent>
<requestHandler name="/suggest" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="suggest">true</str>
<str name="suggest.count">10</str>
<str name="suggest.dictionary">words_suggester</str>
<str name="suggest.dictionary">cities_suggester</str>
...
</lst>
<arr name="components">
<str>suggest</str>
</arr>
</requestHandler>
建议者
FuzzyLookupFactory
文件字典工厂
words.txt
单词
一串
城市建议者
FuzzyLookupFactory
文件字典工厂
cities.txt
城市条例
一串
...
根据我的测试,似乎每个基于FileDictionaryFactory的建议器必须使用不同的storeDir(否则它们会相互覆盖)
然后,在“/suggest”请求处理程序中使用它们,例如:
<searchComponent name="suggest" class="solr.SuggestComponent">
<lst name="suggester">
<str name="name">words_suggester</str>
<str name="lookupImpl">FuzzyLookupFactory</str>
<str name="dictionaryImpl">FileDictionaryFactory</str>
<str name="sourceLocation">words.txt</str>
<str name="storeDir">words_dict</str>
<str name="suggestAnalyzerFieldType">string</str>
</lst>
<lst name="suggester">
<str name="name">cities_suggester</str>
<str name="lookupImpl">FuzzyLookupFactory</str>
<str name="dictionaryImpl">FileDictionaryFactory</str>
<str name="sourceLocation">cities.txt</str>
<str name="storeDir">cities_dict</str>
<str name="suggestAnalyzerFieldType">string</str>
</lst>
...
</searchComponent>
<requestHandler name="/suggest" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="suggest">true</str>
<str name="suggest.count">10</str>
<str name="suggest.dictionary">words_suggester</str>
<str name="suggest.dictionary">cities_suggester</str>
...
</lst>
<arr name="components">
<str>suggest</str>
</arr>
</requestHandler>
真的
10
建议者
城市建议者
...
建议
合并这些字典文件是一种选择吗?当然是一种选择。不过,正如我在问题中所说,它们的规模和波动性各不相同。因此,如果每小时更改一次的字典与很少更改的字典不在同一个文件中,则维护更方便。好的,sourceLocation可以有一个文件。这似乎也表明了这一点,尽管它并不明确。