Hadoop 跳跃与滑动窗口

Hadoop 跳跃与滑动窗口,hadoop,streaming,windowing,Hadoop,Streaming,Windowing,我知道翻滚窗口是为间隔设置的,事件不会重叠,并在设置的时间间隔过期。现在,跳跃窗口和滑动窗口重叠,在跳跃窗口的情况下,我们有一个跳跃间隔和正常窗口间隔,滑动窗口有一个滑动间隔而不是窗口间隔。我看了这个链接,我明白了,但滑动间隔似乎也是一样的。有人能帮我解释一下区别吗。微软有一个很好的解释。基本上,一个跳跃窗口总是从时间序列的开始向前移动一个特定的时间间隔。滑动窗口仅在时间序列中存在要评估的数据时前进 数据集: 时间T:18 T+1:12 T+7:20 T+11:15 T+16:19 T+27:1

我知道翻滚窗口是为间隔设置的,事件不会重叠,并在设置的时间间隔过期。现在,跳跃窗口和滑动窗口重叠,在跳跃窗口的情况下,我们有一个跳跃间隔和正常窗口间隔,滑动窗口有一个滑动间隔而不是窗口间隔。我看了这个链接,我明白了,但滑动间隔似乎也是一样的。有人能帮我解释一下区别吗。

微软有一个很好的解释。基本上,一个跳跃窗口总是从时间序列的开始向前移动一个特定的时间间隔。滑动窗口仅在时间序列中存在要评估的数据时前进

数据集:

时间T:18 T+1:12 T+7:20 T+11:15 T+16:19 T+27:107 跳跃: 从时间T开始,对10秒窗口的值求和,前进5秒

T-T10:50 18+12+20 T5-T15:35 20+15 T10-T20:2415+19 T15-T25:19 T20-T30:107 滑动:从时间T开始,对10秒窗口的值求和

T:50 18+12+20 T1:4712+20+15 T7:4420+15+19 T11:2415+19 T16:19 T27:107
跳转窗口更基于时间表,在每个周期上生成正好该周期的输出。流式窗口更基于事件,仅当数据存在时才产生输出。

我对此也感到困惑,但下面的链接旨在通过说明滑动窗口是一个固定大小的窗口,与跳跃窗口不同,它随时间滑动,从而区分它们。它仍然有点困惑,也许它回答了你的问题@谢谢,我会看看的。