Search bin/nutch弹性指数文件
有很多使用Search bin/nutch弹性指数文件,search,solr,elasticsearch,nutch,Search,Solr,elasticsearch,Nutch,有很多使用bin/nutch solrindex命令的文档和示例,但是bin/nutch elasticindex命令缺乏涵盖范围。我正在努力将Nutch 2.2.1的一个实例与Elasticsearch 0.90.2结合起来。我曾尝试使用将Elasticsearch伪装为Solr实例,但任何bin/crawl作业都会因内部服务器错误而崩溃。我要找的是一个修改为使用Elasticsearch的bin/crawl示例或bin/nutch elasticindex命令的详细说明(nutch wiki
bin/nutch solrindex
命令的文档和示例,但是bin/nutch elasticindex
命令缺乏涵盖范围。我正在努力将Nutch 2.2.1的一个实例与Elasticsearch 0.90.2结合起来。我曾尝试使用将Elasticsearch伪装为Solr实例,但任何bin/crawl
作业都会因内部服务器错误而崩溃。我要找的是一个修改为使用Elasticsearch的bin/crawl
示例或bin/nutch elasticindex
命令的详细说明(nutch wiki没有页面)。我可以用elasticindex
自由替换短语solrindex
的每次出现吗?我修改了bin/crawl
以删除bin/nutch solrdedep
命令,并将所有提到的solrindex
替换为elasticindex
我认为不可能让Nutch 2.2.x与Elasticsearch一起工作。但与1.8相比,我看不到2.2.x的额外好处。唯一的问题是Nutch2.2.x使用Gora将爬网页面保存在您选择的数据库中。由于您使用Elasticsearch对结果进行索引,我假设您不需要数据库。
我使用Elasticsearch 0.90.11制作了Nutch 1.8,您可以在我的GitHub帐户上找到该捆绑包: