Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/mongodb/12.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
错误:使用mongodb启动Apache nutch时出错_Mongodb_Apache_Nutch - Fatal编程技术网

错误:使用mongodb启动Apache nutch时出错

错误:使用mongodb启动Apache nutch时出错,mongodb,apache,nutch,Mongodb,Apache,Nutch,当我尝试运行时,出现以下错误,在mongodb日志中,一个连接被接受并立即结束。如何解决它? $bin/crawl conf/url/seeds.txt图图1 没有指定SOLRURL。跳过索引。 注入种子URL /e/apache-nutch/apache-nutch-2.3.1/runtime/local/bin/nutch-inject-conf/url/seeds.txt-crawrid-tuto 注射工工作时间:2016-10-01 18:15:14 InjectorJob:注入urlD

当我尝试运行时,出现以下错误,在mongodb日志中,一个连接被接受并立即结束。如何解决它?

$bin/crawl conf/url/seeds.txt图图1 没有指定SOLRURL。跳过索引。 注入种子URL /e/apache-nutch/apache-nutch-2.3.1/runtime/local/bin/nutch-inject-conf/url/seeds.txt-crawrid-tuto 注射工工作时间:2016-10-01 18:15:14 InjectorJob:注入urlDir:conf/url/seeds.txt InjectorJob:使用类org.apache.gora.mongodb.store.MongoStore作为gora存储类。 InjectorJob:java.lang.NullPointerException 位于java.lang.ProcessBuilder.start(ProcessBuilder.java:1010) 位于org.apache.hadoop.util.Shell.runCommand(Shell.java:482) 位于org.apache.hadoop.util.Shell.run(Shell.java:455) 位于org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:702) 位于org.apache.hadoop.util.Shell.execCommand(Shell.java:791) 位于org.apache.hadoop.util.Shell.execCommand(Shell.java:774) 位于org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:646) 位于org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:434) 位于org.apache.hadoop.fs.FilterFileSystem.mkdirs(FilterFileSystem.java:281) 位于org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir(JobSubmissionFiles.java:125) 位于org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:348) 位于org.apache.hadoop.mapreduce.Job$10.run(Job.java:1285) 位于org.apache.hadoop.mapreduce.Job$10.run(Job.java:1282) 位于java.security.AccessController.doPrivileged(本机方法) 位于javax.security.auth.Subject.doAs(Subject.java:415) 位于org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1614) 位于org.apache.hadoop.mapreduce.Job.submit(Job.java:1282) 位于org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1303) 位于org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:115) 位于org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:231) 位于org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:252) 位于org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:275) 位于org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
在org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:284)

# bin/nutch inject seedDirectory/

这至少对我有效。

我只需删除两行即可解决此问题,即:

[field name="sitemaps" docfield="sitemaps" type="document"] 

来自nutch的
conf
文件夹中的
gora mongodb mapping.xml
文件。希望对你有帮助

[field name="stmPriority" docfield="stmPriority" type="int32"]