Hadoop 跳跃与滑动窗口_Hadoop_Streaming_Windowing

Hadoop 跳跃与滑动窗口

hadoop streaming

Hadoop 跳跃与滑动窗口,hadoop,streaming,windowing,Hadoop,Streaming,Windowing,我知道翻滚窗口是为间隔设置的，事件不会重叠，并在设置的时间间隔过期。现在，跳跃窗口和滑动窗口重叠，在跳跃窗口的情况下，我们有一个跳跃间隔和正常窗口间隔，滑动窗口有一个滑动间隔而不是窗口间隔。我看了这个链接，我明白了，但滑动间隔似乎也是一样的。有人能帮我解释一下区别吗。微软有一个很好的解释。基本上，一个跳跃窗口总是从时间序列的开始向前移动一个特定的时间间隔。滑动窗口仅在时间序列中存在要评估的数据时前进数据集：时间T:18 T+1:12 T+7:20 T+11:15 T+16:19 T+27:1

我知道翻滚窗口是为间隔设置的，事件不会重叠，并在设置的时间间隔过期。现在，跳跃窗口和滑动窗口重叠，在跳跃窗口的情况下，我们有一个跳跃间隔和正常窗口间隔，滑动窗口有一个滑动间隔而不是窗口间隔。我看了这个链接，我明白了，但滑动间隔似乎也是一样的。有人能帮我解释一下区别吗。

微软有一个很好的解释。基本上，一个跳跃窗口总是从时间序列的开始向前移动一个特定的时间间隔。滑动窗口仅在时间序列中存在要评估的数据时前进

数据集：

时间T:18 T+1:12 T+7:20 T+11:15 T+16:19 T+27:107 跳跃：从时间T开始，对10秒窗口的值求和，前进5秒

T-T10:50 18+12+20 T5-T15:35 20+15 T10-T20:2415+19 T15-T25:19 T20-T30:107 滑动：从时间T开始，对10秒窗口的值求和

T:50 18+12+20 T1:4712+20+15 T7:4420+15+19 T11:2415+19 T16:19 T27:107

跳转窗口更基于时间表，在每个周期上生成正好该周期的输出。流式窗口更基于事件，仅当数据存在时才产生输出。

我对此也感到困惑，但下面的链接旨在通过说明滑动窗口是一个固定大小的窗口，与跳跃窗口不同，它随时间滑动，从而区分它们。它仍然有点困惑，也许它回答了你的问题@谢谢，我会看看的。