Lucene JackRabbit:TextFilterClass已弃用。如何指定提取器?

Lucene JackRabbit:TextFilterClass已弃用。如何指定提取器?,lucene,jackrabbit,jcr,Lucene,Jackrabbit,Jcr,我的Jackrabbit 2.4说,SearchIndex元素的textFilterClasses参数已被弃用并忽略。当我一起删除textFilterClasses参数时,它为Pdf、Rtf-everything建立索引 当我没有指定提取器时,它如何知道应该索引哪些二进制文件 API说它已被弃用,但没有提供任何替代方案 谢谢大家! Jackrabbit 2.x引入了Apache Tika作为默认二进制文件解析器。默认情况下,Jackrabbit附带一个默认的tika-config.xml文件,其

我的Jackrabbit 2.4说,SearchIndex元素的textFilterClasses参数已被弃用并忽略。当我一起删除textFilterClasses参数时,它为Pdf、Rtf-everything建立索引

当我没有指定提取器时,它如何知道应该索引哪些二进制文件

API说它已被弃用,但没有提供任何替代方案


谢谢大家!

Jackrabbit 2.x引入了Apache Tika作为默认二进制文件解析器。默认情况下,Jackrabbit附带一个默认的tika-config.xml文件,其中包含要解析和提取的mime类型的配置

在Jackrabbit 2.4中,您应该能够从repository.xml中设置tika-config.xml的位置

搜索索引配置中的正确参数应类似于:

<SearchIndex class="org.apache.jackrabbit.core.query.lucene.SearchIndex">
  <param name="path" value="${wsp.home}/index"/>
  <param name="supportHighlighting" value="true"/>
  <param name="tikaConfigPath" value="${wsp.home}/tika-config.xml"/>
</SearchIndex>