Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/321.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java ApacheNutch1.5和Solr4.7索引_Java_Solr_Lucene_Nutch - Fatal编程技术网

Java ApacheNutch1.5和Solr4.7索引

Java ApacheNutch1.5和Solr4.7索引,java,solr,lucene,nutch,Java,Solr,Lucene,Nutch,我已经使用ApacheNutch对网站进行了爬网,并希望在solr中对数据进行索引。我一直在学习上面提到的教程 但是,本教程在爬行时提到了索引,但在我的例子中,我需要索引已经爬行的数据 我正在运行下面的命令 bin/nutch solrindex http://127.0.0.1:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/* [abc@xyz nutch-crawler]$ bin/nutch index http

我已经使用ApacheNutch对网站进行了爬网,并希望在solr中对数据进行索引。我一直在学习上面提到的教程 但是,本教程在爬行时提到了索引,但在我的例子中,我需要索引已经爬行的数据

我正在运行下面的命令

bin/nutch solrindex http://127.0.0.1:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl/segments/*

[abc@xyz nutch-crawler]$ bin/nutch index http://abc.xyz:8983/solr/ pryder/crawldb/ -linkdb pryder/linkdb/ pryder/segments/20140330021243/
Indexer: starting at 2014-04-02 20:34:09
Indexer: deleting gone documents: false
Indexer: URL filtering: false
Indexer: URL normalizing: false
Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/solr/client/solrj/impl/CommonsHttpSolrServer
    at java.lang.Class.getDeclaredConstructors0(Native Method)
    at java.lang.Class.privateGetDeclaredConstructors(Class.java:2398)
    at java.lang.Class.getConstructor0(Class.java:2708)
    at java.lang.Class.newInstance0(Class.java:328)
    at java.lang.Class.newInstance(Class.java:310)
    at org.apache.nutch.plugin.Extension.getExtensionInstance(Extension.java:157)
    at org.apache.nutch.indexer.IndexWriters.<init>(IndexWriters.java:57)
    at org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:91)
    at org.apache.nutch.indexer.IndexingJob.run(IndexingJob.java:176)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
    at org.apache.nutch.indexer.IndexingJob.main(IndexingJob.java:186)
Caused by: java.lang.ClassNotFoundException: org.apache.solr.client.solrj.impl.CommonsHttpSolrServer
    at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
    at java.security.AccessController.doPrivileged(Native Method)
    at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:306)
    at java.lang.ClassLoader.loadClass(ClassLoader.java:247)
    ... 11 more
bin/nutch solrindexhttp://127.0.0.1:8983/solr/ 爬网/爬网数据库-linkdb爬网/linkdb爬网/段/*
[abc@xyz坚果爬虫]$bin/坚果索引http://abc.xyz:8983/solr/ pryder/crawdb/-linkdb-pryder/linkdb/pryder/segments/20140330021243/
索引器:从2014-04-02 20:34:09开始
索引器:删除丢失的文档:false
索引器:URL筛选:false
索引器:URL规范化:false
线程“main”java.lang.NoClassDefFoundError中出现异常:org/apache/solr/client/solrj/impl/CommonsHttpSolrServer
位于java.lang.Class.getDeclaredConstructors0(本机方法)
位于java.lang.Class.privateGetDeclaredConstructors(Class.java:2398)
位于java.lang.Class.getConstructor0(Class.java:2708)
位于java.lang.Class.newInstance0(Class.java:328)
位于java.lang.Class.newInstance(Class.java:310)
位于org.apache.nutch.plugin.Extension.getExtensionInstance(Extension.java:157)
位于org.apache.nutch.indexer.IndexWriters.(IndexWriters.java:57)
位于org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:91)
位于org.apache.nutch.indexer.IndexingJob.run(IndexingJob.java:176)
位于org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
位于org.apache.nutch.indexer.IndexingJob.main(IndexingJob.java:186)
原因:java.lang.ClassNotFoundException:org.apache.solr.client.solrj.impl.CommonsHttpSolrServer
位于java.net.URLClassLoader$1.run(URLClassLoader.java:202)
位于java.security.AccessController.doPrivileged(本机方法)
位于java.net.URLClassLoader.findClass(URLClassLoader.java:190)
位于java.lang.ClassLoader.loadClass(ClassLoader.java:306)
位于java.lang.ClassLoader.loadClass(ClassLoader.java:247)
... 还有11个

这里会出什么问题?

只是一个想法,似乎您在CommonHttpSolrServer版本中出现了一些不匹配的问题,我认为它是SOLR 3.x而不是4.x。检查这里,看看它是否有帮助或为您指明了正确的方向,我刚刚在SOLR 3.4上尝试过,仍然是相同的问题。您是否完全遵循本教程?这看起来像是类路径问题。你写了什么吗,我是说源代码?什么都没有。事实上,我认为这是nutch命令的问题