Tomcat 在Solr1.4.1上获得404for/solr/update/extract&；蒂卡0.4_Tomcat_Solr_Apache Tika

Tomcat 在Solr1.4.1上获得404for/solr/update/extract&；蒂卡0.4

tomcat solr

Tomcat 在Solr1.4.1上获得404for/solr/update/extract&；蒂卡0.4,tomcat,solr,apache-tika,Tomcat,Solr,Apache Tika,我已经成功地安装了Solr 1.4.1，但我无法使Tika 0.4（包含在contrib/extraction中）正常工作。我在尝试命中时出现404错误（“ss”是我的核心）部署之后，我将所有contrib/extraction jar以及驻留在“dist”目录中的“Solr cell”jar移动到了Solr的WEB-INF目录中我在上面使用的方法适用于Solr3.3，但Tika0.8中破坏了PDF解析，因此我决定返回Solr1.4.1和Tika0.4 如果有帮助的话，我正在使用Tomcat

我已经成功地安装了Solr 1.4.1，但我无法使Tika 0.4（包含在contrib/extraction中）正常工作。我在尝试命中时出现404错误（“ss”是我的核心）

部署之后，我将所有contrib/extraction jar以及驻留在“dist”目录中的“Solr cell”jar移动到了Solr的WEB-INF目录中

我在上面使用的方法适用于Solr3.3，但Tika0.8中破坏了PDF解析，因此我决定返回Solr1.4.1和Tika0.4

如果有帮助的话，我正在使用Tomcat 7.0。

我解决了这个问题

我复制了多核目录（“example/multicore中的core0”和“core1”），它们使用的是非常精简的solrconfig.xml版本。我参考了默认示例（位于example/solr中），抓取了“update/extract”的“requestHandler”部分，将其放在我的solrconfig.xml的精简版本中，并在Tomcat中重新启动了solr web应用程序，现在文件解析工作得非常好

我希望这对其他人有所帮助。

我一直在Solr 5.3.1中使用django_haystack，在定制schema.xml时遇到了同样的问题，我想补充一下Travis的答案

需要在solrconfig.xml中添加的行如下：

在lucene版本定义下

<luceneMatchVersion>5.3.1</luceneMatchVersion>

我希望这有帮助

<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/contrib/dataimporthandler/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-dataimporthandler-.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-cell-\d.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-clustering-\d.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/langid/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-langid-\d.*\.jar" />

<lib dir="${solr.install.dir:../../../..}/contrib/velocity/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-velocity-\d.*\.jar" />

<requestHandler name="/update/extract"
  startup="lazy"
  class="solr.extraction.ExtractingRequestHandler" >
  <lst name="defaults">
    <str name="lowernames">true</str>
    <str name="uprefix">ignored_</str>

    <!-- capture link hrefs but ignore div attributes -->
    <str name="captureAttr">true</str>
    <str name="fmap.a">links</str>
    <str name="fmap.div">ignored_</str>
  </lst>
</requestHandler>