在MapReduce中如何进行洗牌?
在MapReduce中如何进行洗牌?,mapreduce,Mapreduce,这看起来很简单,但有一件事我不太明白,那就是洗牌是怎么做的?如何在这里为每个单词创建一个篮子?map的输出键、值对(我们称它们为K、V)根据键的散列进行分区 具有相同的散列(K)的所有K,V对被发送到同一个reducer。每个减速器中的K,V对按键排序并按键分组 reduce然后依次处理每个键及其所有相关值 注意:在Hadoop(可能还有其他M/R实现)中,分区、排序和分组功能可以由用户定义 map的输出键、值对(我们称之为K,V)基于键的散列进行分区 具有相同的散列(K)的所有K,V对被发送到
这看起来很简单,但有一件事我不太明白,那就是洗牌是怎么做的?如何在这里为每个单词创建一个篮子?
map
的输出键、值对(我们称它们为K、V
)根据键的散列进行分区
具有相同的散列(K)
的所有K,V
对被发送到同一个reducer。每个减速器中的K,V
对按键排序并按键分组
reduce
然后依次处理每个键及其所有相关值
注意:在Hadoop(可能还有其他M/R实现)中,分区、排序和分组功能可以由用户定义
map
的输出键、值对(我们称之为K,V
)基于键的散列进行分区
具有相同的散列(K)
的所有K,V
对被发送到同一个reducer。每个减速器中的K,V
对按键排序并按键分组
reduce
然后依次处理每个键及其所有相关值
N、 B.在Hadoop(可能还有其他M/R实现)中,分区、排序和分组功能可以由用户定义