Java Hadoop-保存日志数据和开发GUI

Java Hadoop-保存日志数据和开发GUI,java,python,hadoop,Java,Python,Hadoop,我正在为我的新项目进行研究,以下是我的项目、研究和问题的详细信息: 项目: 保存来自不同来源的日志(例如,格式为时间戳、日志条目、位置、备注等)。在这里,不同的来源类似于从全球不同的系统获取日志数据(只是一个概述) (按照1中的规定在Hadoop中保存日志条目后)根据需要生成Hadoop中保存的日志报告,如向下钻取、向上钻取等 注意:每分钟大约有50到60 MB的系统日志条目(我检查过了) 研究和问题: 为了在Hadoop中保存来自不同来源的日志条目,我们使用了ApacheFlume 我们正在创

我正在为我的新项目进行研究,以下是我的项目、研究和问题的详细信息:

项目:

  • 保存来自不同来源的日志(例如,格式为时间戳、日志条目、位置、备注等)。在这里,不同的来源类似于从全球不同的系统获取日志数据(只是一个概述)

  • (按照1中的规定在Hadoop中保存日志条目后)根据需要生成Hadoop中保存的日志报告,如向下钻取、向上钻取等

  • 注意:每分钟大约有50到60 MB的系统日志条目(我检查过了)

    研究和问题:

  • 为了在Hadoop中保存来自不同来源的日志条目,我们使用了ApacheFlume
  • 我们正在创建自己的MR程序和servlet
  • 除了水槽,还有什么好的选择吗? 是否有任何Hadoop数据分析(开源)工具来生成报告等


    我正在做我的研究,如果我们中的任何人给我添加一些评论,这将是有益的

    我想你可以用蜂箱。即使我是Hadoop新手,但我也读了一些关于Hadoop分析的文章。不确定它是否有GUI,但可以肯定它具有查询非结构化数据的SQL功能。

    您看过Datameer吗?它提供了一个GUI来导入所有这些类型的文件,并创建报告和仪表板。

    是的,但它不是开源的。此外,我们需要开源,以便我们可以修改它。是的,你是对的。我们用的是猪。蜂巢或猪没有GUI。