使用Gora集成Nutch-Hbase和Solr

使用Gora集成Nutch-Hbase和Solr,solr,hbase,nutch,gora,Solr,Hbase,Nutch,Gora,我遵循了nutch2教程并成功地将nutch与HBase集成 我的问题是当我使用以下命令抓取url时 /nutch crawl url/seed.txt abc-depth 50-topN 50在运行时/local/bin目录中 发生错误: Exception in thread "main" java.lang.RuntimeException: job failed: name=generate: null, jobid=job_local1552667151_0002 at

我遵循了nutch2教程并成功地将nutch与HBase集成 我的问题是当我使用以下命令抓取url时
/nutch crawl url/seed.txt abc-depth 50-topN 50
运行时/local/bin
目录中

发生错误:

Exception in thread "main" java.lang.RuntimeException: job failed: name=generate: null, jobid=job_local1552667151_0002
        at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54)
        at org.apache.nutch.crawl.GeneratorJob.run(GeneratorJob.java:199)
        at org.apache.nutch.crawl.Crawler.runTool(Crawler.java:68)
        at org.apache.nutch.crawl.Crawler.run(Crawler.java:152)
        at org.apache.nutch.crawl.Crawler.run(Crawler.java:250)
        at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
        at org.apache.nutch.crawl.Crawler.main(Crawler.java:257)

请给我一个解决方案。任何解决方案都将不胜感激

正如大多数人可能建议的那样,hadoop.log是寻找更好的错误描述的好地方。在没有这些信息的情况下,我将冒险进行以下猜测:

  • 您已在windows机箱上安装nutch
  • 您正在cygwin中运行hbase(试图在cygwin中直接运行hbase) windows命令提示符很可能会失败(无论如何)
  • 您可能遇到了hdfs文件系统错误(正在检查) hadoop.log将告诉您是否是这种情况)
  • 以下是发布在apache issues jira中的一个解决方法: 另一个善良的灵魂为它贴上了补丁: 如果这确实是您遇到的问题,请使用上面补丁中提到的WinLocalFileSystem类,并通过在nutch-site.xml中添加以下内容来配置nutch以使用它:

    <property>
        <name>fs.file.impl</name>
        <value>org.apache.nutch.util.WinLocalFileSystem</value>
        <description>Enables patch for issue HADOOP-7682 on Windows
        </description>
    </property>
    
    
    fs.file.impl
    org.apache.nutch.util.WinLocalFileSystem
    在Windows上为HADOOP-7682问题启用修补程序
    
    您是否能够解决此问题?我也有同样的问题。