Apache spark Apache Drill-内存/流作为数据源_Apache Spark_Apache Drill

Apache spark Apache Drill-内存/流作为数据源

apache-spark

Apache spark Apache Drill-内存/流作为数据源,apache-spark,apache-drill,Apache Spark,Apache Drill,这可能滥用了Drill的精神，但我想知道是否有人试图将Drill查询指向内存或数据流也许： local> select columns[0], avg(columns[5]) from dfs.`tail -f /users/home/carl/incoming.log` group by columns[0], columns[5]; 使其更像“火花”-类似于？这在使用文件的钻孔中不起作用。然而，演练1.12增加了对卡夫卡的支持。因此，您可以在Kafka主题中对数据流执行查询。这在D

这可能滥用了Drill的精神，但我想知道是否有人试图将Drill查询指向内存或数据流

也许：

local> select columns[0], avg(columns[5]) from dfs.`tail -f /users/home/carl/incoming.log` group by columns[0], columns[5];

使其更像“火花”-类似于？

这在使用文件的钻孔中不起作用。然而，演练1.12增加了对卡夫卡的支持。因此，您可以在Kafka主题中对数据流执行查询。

这在Drill中不受支持。我认为如果不使用流式和all，Spark SQL将无法实现这一点。