elasticsearch,nutch,Search,Solr,elasticsearch,Nutch" /> elasticsearch,nutch,Search,Solr,elasticsearch,Nutch" />

Search bin/nutch弹性指数文件

Search bin/nutch弹性指数文件,search,solr,elasticsearch,nutch,Search,Solr,elasticsearch,Nutch,有很多使用bin/nutch solrindex命令的文档和示例,但是bin/nutch elasticindex命令缺乏涵盖范围。我正在努力将Nutch 2.2.1的一个实例与Elasticsearch 0.90.2结合起来。我曾尝试使用将Elasticsearch伪装为Solr实例,但任何bin/crawl作业都会因内部服务器错误而崩溃。我要找的是一个修改为使用Elasticsearch的bin/crawl示例或bin/nutch elasticindex命令的详细说明(nutch wiki

有很多使用
bin/nutch solrindex
命令的文档和示例,但是
bin/nutch elasticindex
命令缺乏涵盖范围。我正在努力将Nutch 2.2.1的一个实例与Elasticsearch 0.90.2结合起来。我曾尝试使用将Elasticsearch伪装为Solr实例,但任何
bin/crawl
作业都会因内部服务器错误而崩溃。我要找的是一个修改为使用Elasticsearch的
bin/crawl
示例或
bin/nutch elasticindex
命令的详细说明(nutch wiki没有页面)。我可以用
elasticindex
自由替换短语
solrindex
的每次出现吗?

我修改了
bin/crawl
以删除
bin/nutch solrdedep
命令,并将所有提到的
solrindex
替换为
elasticindex

我认为不可能让Nutch 2.2.x与Elasticsearch一起工作。但与1.8相比,我看不到2.2.x的额外好处。唯一的问题是Nutch2.2.x使用Gora将爬网页面保存在您选择的数据库中。由于您使用Elasticsearch对结果进行索引,我假设您不需要数据库。 我使用Elasticsearch 0.90.11制作了Nutch 1.8,您可以在我的GitHub帐户上找到该捆绑包: