Tomcat 在Solr1.4.1上获得404for/solr/update/extract&;蒂卡0.4

Tomcat 在Solr1.4.1上获得404for/solr/update/extract&;蒂卡0.4,tomcat,solr,apache-tika,Tomcat,Solr,Apache Tika,我已经成功地安装了Solr 1.4.1,但我无法使Tika 0.4(包含在contrib/extraction中)正常工作。我在尝试命中时出现404错误(“ss”是我的核心) 部署之后,我将所有contrib/extraction jar以及驻留在“dist”目录中的“Solr cell”jar移动到了Solr的WEB-INF目录中 我在上面使用的方法适用于Solr3.3,但Tika0.8中破坏了PDF解析,因此我决定返回Solr1.4.1和Tika0.4 如果有帮助的话,我正在使用Tomcat

我已经成功地安装了Solr 1.4.1,但我无法使Tika 0.4(包含在contrib/extraction中)正常工作。我在尝试命中时出现404错误(“ss”是我的核心)

部署之后,我将所有contrib/extraction jar以及驻留在“dist”目录中的“Solr cell”jar移动到了Solr的WEB-INF目录中

我在上面使用的方法适用于Solr3.3,但Tika0.8中破坏了PDF解析,因此我决定返回Solr1.4.1和Tika0.4

如果有帮助的话,我正在使用Tomcat 7.0。

我解决了这个问题

我复制了多核目录(“example/multicore中的core0”和“core1”),它们使用的是非常精简的solrconfig.xml版本。我参考了默认示例(位于example/solr中),抓取了“update/extract”的“requestHandler”部分,将其放在我的solrconfig.xml的精简版本中,并在Tomcat中重新启动了solr web应用程序,现在文件解析工作得非常好


我希望这对其他人有所帮助。

我一直在Solr 5.3.1中使用django_haystack,在定制schema.xml时遇到了同样的问题,我想补充一下Travis的答案

需要在solrconfig.xml中添加的行如下:

在lucene版本定义下

<luceneMatchVersion>5.3.1</luceneMatchVersion>
我希望这有帮助

<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/contrib/dataimporthandler/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-dataimporthandler-.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-cell-\d.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-clustering-\d.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/langid/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-langid-\d.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/velocity/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-velocity-\d.*\.jar" />
<requestHandler name="/update/extract"
  startup="lazy"
  class="solr.extraction.ExtractingRequestHandler" >
  <lst name="defaults">
    <str name="lowernames">true</str>
    <str name="uprefix">ignored_</str>

    <!-- capture link hrefs but ignore div attributes -->
    <str name="captureAttr">true</str>
    <str name="fmap.a">links</str>
    <str name="fmap.div">ignored_</str>
  </lst>
</requestHandler>