Mongodb Nutch REST api结果(有限)
我刚刚了解了如何通过2.3版本的Nutch的RESTAPI完成Nutch爬网。你可以看到我的帖子。所以在运行爬网之后,我去MongoVue查看结果,没有“status”或“baseUrl”字段以及其他字段。现在,如果我通过cygwin做一个普通的爬行,我会得到所有字段。在UPDATEDB调用的POST请求中是否缺少一些参数 这是我为Updatedb打的最后一个电话Mongodb Nutch REST api结果(有限),mongodb,api,rest,nutch,Mongodb,Api,Rest,Nutch,我刚刚了解了如何通过2.3版本的Nutch的RESTAPI完成Nutch爬网。你可以看到我的帖子。所以在运行爬网之后,我去MongoVue查看结果,没有“status”或“baseUrl”字段以及其他字段。现在,如果我通过cygwin做一个普通的爬行,我会得到所有字段。在UPDATEDB调用的POST请求中是否缺少一些参数 这是我为Updatedb打的最后一个电话 { "args":{ "crawlId":"crawl-01", "batch":"1428526896161-
{
"args":{
"crawlId":"crawl-01",
"batch":"1428526896161-4430"
},
"confId":"default",
"crawlId":"crawl-01",
"type":"UPDATEDB"
}
我想出来了。GenerateJob步骤中使用的时间戳错误。它需要采用特定的格式,而我的代码不支持它。找到一份工作