Apache flink ApacheFlink：如何在翻滚时间窗口中使用DISTINCT？_Apache Flink_Flink Streaming_Flink Sql

Apache flink ApacheFlink：如何在翻滚时间窗口中使用DISTINCT？

apache-flink

Apache flink ApacheFlink：如何在翻滚时间窗口中使用DISTINCT？,apache-flink,flink-streaming,flink-sql,Apache Flink,Flink Streaming,Flink Sql,我有这样一个流：。 \u time属性是rowtime，我将其注册为一个表： tableEnv.registerDataStream("userVisitPage", stream, "_time.rowtime, uri,userId"); 然后我查询表： final String sql = "SELECT tumble_start(_time, interval '10' second) as timestart, " + " count(distinct

我有这样一个流：

。

\u time

属性是rowtime，我将其注册为一个表：

tableEnv.registerDataStream("userVisitPage", stream, "_time.rowtime, uri,userId");

然后我查询表：

final String sql =
       "SELECT tumble_start(_time, interval '10' second) as timestart, " +
       "  count(distinct userId) as uv, " +
       "  uri as uri, " +
       "  count(1) as pv " +
       "FROM userVisitPage " +
       "GROUP BY tumble(_time, interval '10' second), uri";

final Table table = tableEnv.sqlQuery(sql);

但是，查询会引发异常：

org.apache.flink.table.codegen.CodeGenException: Unsupported call: TUMBLE 
If you think this function should be supported, you can create an issue and start a discussion for it.
    at org.apache.flink.table.codegen.CodeGenerator$$anonfun$visitCall$3.apply(CodeGenerator.scala:1006)
    at org.apache.flink.table.codegen.CodeGenerator$$anonfun$visitCall$3.apply(CodeGenerator.scala:1006)
    at scala.Option.getOrElse(Option.scala:121)
    at org.apache.flink.table.codegen.CodeGenerator.visitCall(CodeGenerator.scala:1006)
    at org.apache.flink.table.codegen.CodeGenerator.visitCall(CodeGenerator.scala:67)
    at org.apache.calcite.rex.RexCall.accept(RexCall.java:107)
    at org.apache.flink.table.codegen.CodeGenerator.generateExpression(CodeGenerator.scala:234)
    at org.apache.flink.table.codegen.CodeGenerator$$anonfun$7.apply(CodeGenerator.scala:321)
    at org.apache.flink.table.codegen.CodeGenerator$$anonfun$7.apply(CodeGenerator.scala:321)
    at scala.collection.TraversableLike$$anonfun$map$1.apply(TraversableLike.scala:234)
    at scala.collection.TraversableLike$$anonfun$map$1.apply(TraversableLike.scala:234)
    at scala.collection.mutable.ResizableArray$class.foreach(ResizableArray.scala:59)
    at scala.collection.mutable.ArrayBuffer.foreach(ArrayBuffer.scala:48)
    at scala.collection.TraversableLike$class.map(TraversableLike.scala:234)
    at scala.collection.AbstractTraversable.map(Traversable.scala:104)
    at org.apache.flink.table.codegen.CodeGenerator.generateResultExpression(CodeGenerator.scala:321)
    at org.apache.flink.table.plan.nodes.CommonCalc$class.generateFunction(CommonCalc.scala:44)
    at org.apache.flink.table.plan.nodes.datastream.DataStreamCalc.generateFunction(DataStreamCalc.scala:43)
    at org.apache.flink.table.plan.nodes.datastream.DataStreamCalc.translateToPlan(DataStreamCalc.scala:116)
    at org.apache.flink.table.plan.nodes.datastream.DataStreamGroupAggregate.translateToPlan(DataStreamGroupAggregate.scala:113)
    at org.apache.flink.table.plan.nodes.datastream.DataStreamGroupAggregate.translateToPlan(DataStreamGroupAggregate.scala:113)
    at org.apache.flink.table.plan.nodes.datastream.DataStreamCalc.translateToPlan(DataStreamCalc.scala:97)
    at org.apache.flink.table.api.StreamTableEnvironment.translateToCRow(StreamTableEnvironment.scala:837)
    at org.apache.flink.table.api.StreamTableEnvironment.translate(StreamTableEnvironment.scala:764)
    at org.apache.flink.table.api.StreamTableEnvironment.translate(StreamTableEnvironment.scala:734)
    at org.apache.flink.table.api.java.StreamTableEnvironment.toRetractStream(StreamTableEnvironment.scala:414)
    at org.apache.flink.table.api.java.StreamTableEnvironment.toRetractStream(StreamTableEnvironment.scala:357)

如何实现此查询？

更新：Flink 1.6.0可用，并支持流表上的不同聚合

Flink（1.4.x版）还不支持流表上带有

不同的聚合的SQL查询。支持的目标是Flink 1.6，它将在2018年年中之前发布
但是，您可以实现一个计算不同计数的函数，并在注册查询后在查询中使用该函数。查询语法当然会有所不同。
您可以发布异常的完整堆栈跟踪吗？因为它使用窗口，所以如何在窗口时间结束时重置累加器？重置累加器将由窗口末尾的flink自动调用？例如，我们需要在下一个新窗口翻滚之前重置累加器。对不起。我不明白你的问题。我建议将其发布到Flink邮件列表，该列表更适合讨论实现细节。此外，Flink 1.6.0还发布了对不同的聚合的支持。