Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/apache/9.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
学习Apache Drill的知识先决条件是什么?_Apache - Fatal编程技术网

学习Apache Drill的知识先决条件是什么?

学习Apache Drill的知识先决条件是什么?,apache,Apache,我是数据分析/大数据分析的n00b。我目前正在学习统计学和R。我想知道学习和使用Apache Drill的知识先决条件,以便优化学习计划?Drill仍在alpha中,文档非常有限。如果您需要稳定性,短期内Cloudera Impala可能是更好的选择 您将需要学习两件事——如何将数据转换为Drill可以使用的表单,以及如何运行查询。后者是简单易学的SQL 前者更为复杂。非常有限的示例使用Twitter拼花数据格式的本地文件,因此这将是一个很好的起点。对于更现实(即分布式)的场景,请了解HDFS(

我是数据分析/大数据分析的n00b。我目前正在学习统计学和R。我想知道学习和使用Apache Drill的知识先决条件,以便优化学习计划?

Drill仍在alpha中,文档非常有限。如果您需要稳定性,短期内Cloudera Impala可能是更好的选择

您将需要学习两件事——如何将数据转换为Drill可以使用的表单,以及如何运行查询。后者是简单易学的SQL

前者更为复杂。非常有限的示例使用Twitter拼花数据格式的本地文件,因此这将是一个很好的起点。对于更现实(即分布式)的场景,请了解HDFS(Hadoop分布式文件系统)和Zookeeper、HBase或MongoDB

警告-如果你真的想在真正的大数据环境中使用Drill(你不应该这样,因为它是alpha),你会发现这是一条陡峭的学习曲线,需要很多复杂的信息。分解它的一个好方法可能是:

  • SQL-尝试SQLite
  • NoSQL数据库-MongoDB
  • 分布式文件系统-HDFS
  • 管理分布式环境-Zookeeper
  • 分布式键值存储-HBase
  • 实时分布式查询-Drill或Impala