学习Apache Drill的知识先决条件是什么?
我是数据分析/大数据分析的n00b。我目前正在学习统计学和R。我想知道学习和使用Apache Drill的知识先决条件,以便优化学习计划?Drill仍在alpha中,文档非常有限。如果您需要稳定性,短期内Cloudera Impala可能是更好的选择 您将需要学习两件事——如何将数据转换为Drill可以使用的表单,以及如何运行查询。后者是简单易学的SQL 前者更为复杂。非常有限的示例使用Twitter拼花数据格式的本地文件,因此这将是一个很好的起点。对于更现实(即分布式)的场景,请了解HDFS(Hadoop分布式文件系统)和Zookeeper、HBase或MongoDB 警告-如果你真的想在真正的大数据环境中使用Drill(你不应该这样,因为它是alpha),你会发现这是一条陡峭的学习曲线,需要很多复杂的信息。分解它的一个好方法可能是:学习Apache Drill的知识先决条件是什么?,apache,Apache,我是数据分析/大数据分析的n00b。我目前正在学习统计学和R。我想知道学习和使用Apache Drill的知识先决条件,以便优化学习计划?Drill仍在alpha中,文档非常有限。如果您需要稳定性,短期内Cloudera Impala可能是更好的选择 您将需要学习两件事——如何将数据转换为Drill可以使用的表单,以及如何运行查询。后者是简单易学的SQL 前者更为复杂。非常有限的示例使用Twitter拼花数据格式的本地文件,因此这将是一个很好的起点。对于更现实(即分布式)的场景,请了解HDFS(
- SQL-尝试SQLite
- NoSQL数据库-MongoDB
- 分布式文件系统-HDFS
- 管理分布式环境-Zookeeper
- 分布式键值存储-HBase
- 实时分布式查询-Drill或Impala李>