Apache flink 关于弗林克的两个术语

Apache flink 关于弗林克的两个术语,apache-flink,Apache Flink,有人能帮忙核实以下项目的条款吗 事件时间和事件摄取时间之间的持续时间。我创造了一个术语叫“排队时间” 当前时间戳与正在进行的窗口中最后一个事件的时间之间的持续时间。我创造了一个术语叫“空闲时间” 我提出的条件正确吗?非常感谢你的建议 我目前正在参与编写一些关于Flink的文档。我认为这些术语在某些情况下很有效,但总的来说我有所保留。例如,考虑批处理,或者(重新)在流应用中摄取历史数据。“排队时间”是否有意义地描述了这种情况下事件时间和摄取时间之间的持续时间?也许,也许不是。或者考虑中断后开始

有人能帮忙核实以下项目的条款吗

  • 事件时间和事件摄取时间之间的持续时间。我创造了一个术语叫“排队时间”
  • 当前时间戳与正在进行的窗口中最后一个事件的时间之间的持续时间。我创造了一个术语叫“空闲时间”
我提出的条件正确吗?非常感谢你的建议


我目前正在参与编写一些关于Flink的文档。

我认为这些术语在某些情况下很有效,但总的来说我有所保留。例如,考虑批处理,或者(重新)在流应用中摄取历史数据。“排队时间”是否有意义地描述了这种情况下事件时间和摄取时间之间的持续时间?也许,也许不是。或者考虑中断后开始恢复的情况:此时,当前时间戳和窗口中的最后事件之间的差异不是由于空闲源,而是由于停机时间。p> 在第一种情况下,感觉您的兴趣在于描述和测量不同的延迟源。在这种情况下,我认为有必要区分发布延迟(事件创建和队列中事件存储之间的时间)、接收延迟(发布到MessageBroker和后续接收到Flink之间的时间)和处理延迟,即Flink处理事件所需的时间。处理延迟是由水印、序列化、网络缓冲、检查点屏障对齐、两阶段提交等引起的


我不太清楚空闲时间背后的意图,但可能可以将其定义为自接收到最后一个事件以来在flink源处经过的时间,或者相对于任何特定的操作员实例,定义为自上次接收事件以来经过的时间。

谢谢David。我明白你的意思。但是你有什么建议的条款吗?