在MapReduce中如何进行洗牌?

在MapReduce中如何进行洗牌?,mapreduce,Mapreduce,这看起来很简单,但有一件事我不太明白,那就是洗牌是怎么做的?如何在这里为每个单词创建一个篮子?map的输出键、值对(我们称它们为K、V)根据键的散列进行分区 具有相同的散列(K)的所有K,V对被发送到同一个reducer。每个减速器中的K,V对按键排序并按键分组 reduce然后依次处理每个键及其所有相关值 注意:在Hadoop(可能还有其他M/R实现)中,分区、排序和分组功能可以由用户定义 map的输出键、值对(我们称之为K,V)基于键的散列进行分区 具有相同的散列(K)的所有K,V对被发送到


这看起来很简单,但有一件事我不太明白,那就是洗牌是怎么做的?如何在这里为每个单词创建一个篮子?

map
的输出键、值对(我们称它们为
K、V
)根据键的散列进行分区

具有相同的
散列(K)
的所有
K,V
对被发送到同一个reducer。每个减速器中的
K,V
对按键排序并按键分组

reduce
然后依次处理每个键及其所有相关值


注意:在Hadoop(可能还有其他M/R实现)中,分区、排序和分组功能可以由用户定义

map
的输出键、值对(我们称之为
K,V
)基于键的散列进行分区

具有相同的
散列(K)
的所有
K,V
对被发送到同一个reducer。每个减速器中的
K,V
对按键排序并按键分组

reduce
然后依次处理每个键及其所有相关值

N、 B.在Hadoop(可能还有其他M/R实现)中,分区、排序和分组功能可以由用户定义