Hadoop 当减速器数量较少时,键是否唯一

Hadoop 当减速器数量较少时,键是否唯一,hadoop,mapreduce,Hadoop,Mapreduce,我想问一下,不同的钥匙是否可以在同一个减速器中结束。如果我基于键相同的假设构建减速器,这将是一种有效的方法。假设每个作业配置的减缩器数量为5,并且映射输出中的唯一键为10,理想情况下应该需要10个减缩器,相同的减缩器方法现在将接收2个不同类型的键。考虑哈希分区,意味着一个具有更少约简的场景。 如果定义一个实现了可写可写的类,可以使用它作为关键字,并为等号和hash码方法定义自己的规则,这样您可以根据所需的规则向同一个减速器发送不同的密钥。您不能假设1减速机只接收一个键。 例如,如果映射器输出N键

我想问一下,不同的钥匙是否可以在同一个减速器中结束。如果我基于键相同的假设构建减速器,这将是一种有效的方法。假设每个作业配置的减缩器数量为5,并且映射输出中的唯一键为10,理想情况下应该需要10个减缩器,相同的减缩器方法现在将接收2个不同类型的键。考虑哈希分区,意味着一个具有更少约简的场景。

如果定义一个实现了可写可写的类,可以使用它作为关键字,并为等号和hash码方法定义自己的规则,这样您可以根据所需的规则向同一个减速器发送不同的密钥。您不能假设1减速机只接收一个键。 例如,如果映射器输出
N
键,其中
N>1
,并且如果您恰好设置了1个减速器,则唯一的减速器将接收所有键

但如果控制不同键的数量=减速器的数量,则可以假定每个减速器将始终接收相同的键。
例如,如果映射器恰好输出N个关键点,并且您恰好设置了N个减速器,则每个减速器将只接收1个关键点。

是,不同的关键点可以在同一个减速器中结束。