详细了解MapReduce
我读了一篇关于MapReduce的文章,但我仍然对如何将作业分解为任务(详细)以利用并行处理感到困惑,特别是在以下情况下: 假设在映射过程之后,我们有1亿条记录(键/值对),有5个键,即“key1”、“key2”、“key3”、“key4”、“key5”。第一个密钥有9900万条记录,其余每个密钥有25万条记录。 如果我们有3名工人来完成减少的任务,那么船长如何分配工作?详细了解MapReduce,mapreduce,Mapreduce,我读了一篇关于MapReduce的文章,但我仍然对如何将作业分解为任务(详细)以利用并行处理感到困惑,特别是在以下情况下: 假设在映射过程之后,我们有1亿条记录(键/值对),有5个键,即“key1”、“key2”、“key3”、“key4”、“key5”。第一个密钥有9900万条记录,其余每个密钥有25万条记录。 如果我们有3名工人来完成减少的任务,那么船长如何分配工作? 我曾读到,每个键只由一个减速机处理,因此,如果减速机必须处理“键1”,那么它会比其他键工作得多吗?在这种情况下,减速机的并行
我曾读到,每个键只由一个减速机处理,因此,如果减速机必须处理“键1”,那么它会比其他键工作得多吗?在这种情况下,减速机的并行处理没有多大帮助 Map reduce技术有几个默认假设:
- 确定直线是否与可能有许多三角形面的三维结构相交,然后对每个三角形运行相交确定
- 为大量金融产品定价
希望以上内容有所帮助。具有相同键的输入数据不必分配给一个减速器。许多还原程序可以使用同一个键共享输入数据 例如,想象一下合并排序。映射作业将数组划分为多个子数组。多层reduce作业排序并将这些子数组合并回一个数组。无论数据如何排列在一个数组中,复杂性仍然是O(n logn)。实际上,合并排序在最佳和最坏情况下的复杂度与平均情况相同。合并排序算法分割和合并数组的方式不受数据排列的影响