Nutch 1.2 Solr 3.6集成问题

Nutch 1.2 Solr 3.6集成问题,solr,nutch,Solr,Nutch,我已经使用NUTCH 1.2成功地爬网了一个站点。现在我想将其与solr 3.6集成。问题是当我发出命令时 $bin/nutch solrindex//localhost:8080/solr/crawl/crawdb crawl/linkdb crawl/segments/*发生错误 SolrIndexer: starting at 2013-07-08 14:52:27 java.io.IOException: Job failed! 请帮我解决这个问题 这是我的坚果日志 java.lan

我已经使用NUTCH 1.2成功地爬网了一个站点。现在我想将其与solr 3.6集成。问题是当我发出命令时
$bin/nutch solrindex//localhost:8080/solr/crawl/crawdb crawl/linkdb crawl/segments/*
发生错误

 SolrIndexer: starting at 2013-07-08 14:52:27
java.io.IOException: Job failed!
请帮我解决这个问题

这是我的坚果日志

java.lang.RuntimeException: Invalid version (expected 2, but 60) or the data in not in 'javabin' format
    at org.apache.solr.common.util.JavaBinCodec.unmarshal(JavaBinCodec.java:99)
    at org.apache.solr.client.solrj.impl.BinaryResponseParser.processResponse(BinaryResponseParser.java:41)
    at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request(CommonsHttpSolrServer.java:469)
    at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request(CommonsHttpSolrServer.java:249)
    at org.apache.solr.client.solrj.request.AbstractUpdateRequest.process(AbstractUpdateRequest.java:105)
    at org.apache.solr.client.solrj.SolrServer.add(SolrServer.java:69)
    at org.apache.solr.client.solrj.SolrServer.add(SolrServer.java:54)
    at org.apache.nutch.indexer.solr.SolrWriter.close(SolrWriter.java:75)
    at org.apache.nutch.indexer.IndexerOutputFormat$1.close(IndexerOutputFormat.java:48)
    at org.apache.hadoop.mapred.ReduceTask.runOldReducer(ReduceTask.java:474)
    at org.apache.hadoop.mapred.ReduceTask.run(ReduceTask.java:411)
    at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:216)
2013-07-08 15:17:39,539 ERROR solr.SolrIndexer - java.io.IOException: Job f

这主要是Nutch使用的Solrj版本JAR与您试图集成的Solr3.6之间的javabin不兼容

您需要更新Solrj jar并重新生成作业


按照中提到的步骤操作

你能检查一下solr和nutch日志中提到的错误吗details@Jayendra嘿。。请告诉我在哪里可以找到那些使用hadoop底层的logsnutch,所以请在nucth文件夹中查找hadoop.log文件。@Jayendra Thanx bro。我已经编辑了我的问题并添加了hadoop.log文件。请通过它并引导我