Linux ApacheNutch和Solr集成

Linux ApacheNutch和Solr集成,linux,solr,lucene,nutch,Linux,Solr,Lucene,Nutch,我试着按照下面的步骤操作,但是schema.xml文件有点问题 我被告知nutch为我的项目提供了模式,基本上是这样的 cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/ 我已经在Tomcat中部署了我的solr文件,当我转到solr仪表板时得到的错误是 collection1: org.apache.solr.common.SolrException:org.apache.solr.c

我试着按照下面的步骤操作,但是schema.xml文件有点问题

我被告知nutch为我的项目提供了模式,基本上是这样的

cp ${NUTCH_RUNTIME_HOME}/conf/schema.xml ${APACHE_SOLR_HOME}/example/solr/conf/
我已经在Tomcat中部署了我的solr文件,当我转到solr仪表板时得到的错误是

collection1: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException:
Plugin init failure for [schema.xml] fieldType "text": 
Plugin init failure for [schema.xml] analyzer/filter:
Error loading class 'solr.EnglishPorterFilterFactory'
这与我的solrconfig.xml文件中的这个元素有关(我可以对此进行注释,但不确定这有多重要)


我编辑了我的solrconfig.xml以尝试并包含了一系列随solr附带的jar文件,特别是

<lib path="/etc/solr/collection1/libs/dist/solr-core-4.2.1.jar" />
<lib path="/etc/solr/collection1/libs/dist/solr-analysis-extras-4.2.1.jar" />

但我不认为它们包含缺少的类“solr.EnglishPorterFilterFactory”

有人知道为什么这可能不起作用,或者我错过了什么吗? 顺便说一句,我不是一名Java开发人员,所以毫无疑问这将是一件简单的事情:)

更新 在发现模式中引用了一些旧类之后,我又查看了nutch/conf,tt看起来有一个${nutch_RUNTIME_HOME}/conf/schema-solr4.xml文件似乎可以工作


如果这是正确的,不是100%,但是嘿…

看起来
EnglishPorterFilterFactory
在4.x中已经不存在了。请参见中的注释:

很多不推荐的东西在4.0中消失了。我会照它说的做,请参见。

也使用“${NUTCH_RUNTIME_HOME}/conf/schema-solr4.xml”而不是旧的配置
<lib path="/etc/solr/collection1/libs/dist/solr-core-4.2.1.jar" />
<lib path="/etc/solr/collection1/libs/dist/solr-analysis-extras-4.2.1.jar" />
Deprecated.
  Use SnowballPorterFilterFactory with language="English" instead