elasticsearch 风暴爬虫爬行和索引,elasticsearch,web-crawler,nutch,stormcrawler,elasticsearch,Web Crawler,Nutch,Stormcrawler" /> elasticsearch 风暴爬虫爬行和索引,elasticsearch,web-crawler,nutch,stormcrawler,elasticsearch,Web Crawler,Nutch,Stormcrawler" />

elasticsearch 风暴爬虫爬行和索引

elasticsearch 风暴爬虫爬行和索引,elasticsearch,web-crawler,nutch,stormcrawler,elasticsearch,Web Crawler,Nutch,Stormcrawler,我曾与Nutch 1x合作抓取网站,并使用Elasticsearch对数据进行索引。我最近遇到了风暴爬虫,喜欢它,特别是它的流性质 我是否必须初始化并为Storm crawler将数据发送到的ES服务器创建映射 有了Nutch,只要我启动并运行ES索引,映射就会自行处理。。。除了一些微调。风暴爬虫也是这样吗?或者我必须先初始化索引和映射吗 很高兴听到你喜欢风暴爬虫 如和中所述,基于ES2.x,您应该使用脚本显式设置映射。如果没有它,它可能可以工作,但它不是最优的。我目前正在运行带有ES 5x的S

我曾与Nutch 1x合作抓取网站,并使用Elasticsearch对数据进行索引。我最近遇到了风暴爬虫,喜欢它,特别是它的流性质

我是否必须初始化并为Storm crawler将数据发送到的ES服务器创建映射


有了Nutch,只要我启动并运行ES索引,映射就会自行处理。。。除了一些微调。风暴爬虫也是这样吗?或者我必须先初始化索引和映射吗

很高兴听到你喜欢风暴爬虫


如和中所述,基于ES2.x,您应该使用脚本显式设置映射。如果没有它,它可能可以工作,但它不是最优的。

我目前正在运行带有ES 5x的SC 1.5。那么,我可以在脚本中为映射添加更多字段吗(对于索引索引)?我可以使用Kibana中的控制台来创建索引和映射,而不是使用包含的bash脚本吗?您可以用任何方式创建索引和映射,包括Kibana。是的,映射是可定制的,您可以根据自己的需要进行调整。