Hive 黑斑羚还是蜂巢,以火花为执行引擎?

Hive 黑斑羚还是蜂巢,以火花为执行引擎?,hive,apache-spark-sql,hadoop2,Hive,Apache Spark Sql,Hadoop2,我想设计从HDFS获取数据的Web UI。我想使用存储在HDFS中的数据生成一些报告。我有自己的自定义报告格式。我正在编写RESTAPI来获取数据。但运行配置单元查询会带来延迟问题,因此我需要不同的方法,我可以想出两种方法 使用IMPALA创建表。但我不确定REST是否支持黑斑羚 使用HIVE而不是MR使用SPARK作为执行引擎 spark job server提供REST支持,并使用spark-SQL获取数据 以下哪种方法合适?有没有更好的方法? 请任何人帮忙,因为我在这方面很新。如果延迟是主

我想设计从HDFS获取数据的Web UI。我想使用存储在HDFS中的数据生成一些报告。我有自己的自定义报告格式。我正在编写RESTAPI来获取数据。但运行配置单元查询会带来延迟问题,因此我需要不同的方法,我可以想出两种方法

  • 使用IMPALA创建表。但我不确定REST是否支持黑斑羚

  • 使用HIVE而不是MR使用SPARK作为执行引擎

  • spark job server提供REST支持,并使用spark-SQL获取数据

  • 以下哪种方法合适?有没有更好的方法?
    请任何人帮忙,因为我在这方面很新。

    如果延迟是主要考虑因素,我宁愿选择黑斑羚。它致力于hdfs上的SQL处理,并且做得很好。关于REST api和您正在实现的应用程序逻辑,这似乎是一个好的

    您混淆了带有spark engine的hive和spark sql,后者是spark cli for sqlit my bad。因此,在阅读了一些内容之后,我修改了我的问题。