Apache spark Apache Drill-内存/流作为数据源

Apache spark Apache Drill-内存/流作为数据源,apache-spark,apache-drill,Apache Spark,Apache Drill,这可能滥用了Drill的精神,但我想知道是否有人试图将Drill查询指向内存或数据流 也许: local> select columns[0], avg(columns[5]) from dfs.`tail -f /users/home/carl/incoming.log` group by columns[0], columns[5]; 使其更像“火花”-类似于?这在使用文件的钻孔中不起作用。然而,演练1.12增加了对卡夫卡的支持。因此,您可以在Kafka主题中对数据流执行查询。这在D

这可能滥用了Drill的精神,但我想知道是否有人试图将Drill查询指向内存或数据流

也许:

local> select columns[0], avg(columns[5]) from dfs.`tail -f /users/home/carl/incoming.log` group by columns[0], columns[5];

使其更像“火花”-类似于?

这在使用文件的钻孔中不起作用。然而,演练1.12增加了对卡夫卡的支持。因此,您可以在Kafka主题中对数据流执行查询。

这在Drill中不受支持。我认为如果不使用流式和all,Spark SQL将无法实现这一点。