默认SolrConfig中包含的文件

默认SolrConfig中包含的文件,solr,lucene,Solr,Lucene,我正在尝试优化solr solr>collection1附带的默认solrConfig包含了很多我并不真正需要的LIB。也许有人能帮我们确定目的。(我仅从DIH进口): 请告诉我这些是什么: contrib/extraction/lib solr-cell- contrib/clustering/lib solr-clustering- contrib/langid/lib/ solr-langid contrib/extraction/lib 索尔电池-* 这些库与Tika集成,帮助您索

我正在尝试优化solr

solr>collection1附带的默认solrConfig包含了很多我并不真正需要的LIB。也许有人能帮我们确定目的。(我仅从DIH进口):

请告诉我这些是什么:

contrib/extraction/lib
solr-cell-

contrib/clustering/lib
solr-clustering-

contrib/langid/lib/
solr-langid
contrib/extraction/lib
索尔电池-*

这些库与Tika集成,帮助您索引丰富的文档,如Microsoft Word、Excel等

contrib/clustering/lib
solr聚类-

用于与Carrot集成的集群支持。 集群将帮助您对文档、主题、实体提取等进行分组

contrib/langid/lib/
索尔兰吉德

d用于语言检测。它增加了在索引之前检测文档语言的能力,然后对分析等做出适当的决定


如果您没有使用上述任何功能,请排除JAR,并确保您也从Solr配置文件中删除了映射。

我喜欢这样一个事实,即您是堆栈上唯一的Solr成员:D您能告诉我一件事:刻面不也是分类吗?那么为什么要使用聚类呢?聚类对于人或姓名的主题提取或基于内容的文档聚类来说更具动态性。根据您提供的值,镶嵌面更加静态。