Apache spark Spark中的水印是如何工作的?
我在理解水印、浏览官方文件时感到困惑 这里是图片Apache spark Spark中的水印是如何工作的?,apache-spark,Apache Spark,我在理解水印、浏览官方文件时感到困惑 这里是图片 https://spark.apache.org/docs/latest/img/structured-streaming-watermark-update-mode.png 医生说: the engine will maintain state and allow late data to update the state until (max event time seen by the engine - late threshold &
https://spark.apache.org/docs/latest/img/structured-streaming-watermark-update-mode.png
医生说:
the engine will maintain state and allow late data to update the state until (max event time seen by the engine - late threshold > T)
所以,如果我们看到图像中的水印,在12:15计算的是12:04
。为什么这12:04与发动机看到的最大事件时间-延迟阈值>T
有关?哪个窗口(T)的值更大