elasticsearch与hbase/hadoop进行实时统计_Hadoop_<img Src="//i.stack.imgur.com/RUiNP.png" Height="16" Width="18" Alt="" Class="sponsor Tag Img">elasticsearch_Hbase_Hdfs_Bigdata

elasticsearch与hbase/hadoop进行实时统计

hadoop hbase

elasticsearch与hbase/hadoop进行实时统计,hadoop,elasticsearch,hbase,hdfs,bigdata,Hadoop,elasticsearch,Hbase,Hdfs,Bigdata,我每周要记录数百万个小日志文档，以便：数据挖掘中的即席查询连接、比较、过滤和计算值使用python进行多个全文搜索每天对数百万份文档运行此操作几次我的第一个想法是将所有文档放在HBase/HDFS中，运行Hadoop作业生成统计结果问题是：某些结果必须接近实时所以，经过一些研究，我发现了ElasticSearch，现在我正在考虑传输所有数百万个文档，并使用DSL查询生成统计结果这是个好主意吗？ElasticSearch似乎很容易处理数以百万计/数十亿计的文档。对于实时搜索分

我每周要记录数百万个小日志文档，以便：

数据挖掘中的即席查询
连接、比较、过滤和计算值
使用python进行多个全文搜索
每天对数百万份文档运行此操作几次

我的第一个想法是将所有文档放在HBase/HDFS中，运行Hadoop作业生成统计结果

问题是：某些结果必须接近实时

所以，经过一些研究，我发现了ElasticSearch，现在我正在考虑传输所有数百万个文档，并使用DSL查询生成统计结果

这是个好主意吗？ElasticSearch似乎很容易处理数以百万计/数十亿计的文档。

对于实时搜索分析，弹性搜索是一个不错的选择
绝对比Hadoop/HBase/HDFS更易于设置和处理。
弹性搜索与HBase的良好比较：