Hadoop ChainMapper和ChainReducer的杀手级应用是什么?
我不知怎么搞不清楚,与通常的链式任务(map->reduce->map->map->reduce)相比,ChainMapper(map->map->map->reduce)和ChainReducer(reduce->map->map->map)的用例是什么。是否有使用这两种方法的典型示例或杀手级应用程序?或者,是否有一些著名的系统/应用程序使用了它们中的任何一种?我认为它们适用于在作业管道中使用IdentityMapper或IdentityReducer的步骤很少的情况 考虑到这一点,在给定管道中有两个作业步骤:Hadoop ChainMapper和ChainReducer的杀手级应用是什么?,hadoop,mapreduce,distributed-computing,Hadoop,Mapreduce,Distributed Computing,我不知怎么搞不清楚,与通常的链式任务(map->reduce->map->map->reduce)相比,ChainMapper(map->map->map->reduce)和ChainReducer(reduce->map->map->map)的用例是什么。是否有使用这两种方法的典型示例或杀手级应用程序?或者,是否有一些著名的系统/应用程序使用了它们中的任何一种?我认为它们适用于在作业管道中使用IdentityMapper或IdentityReducer的步骤很少的情况 考虑到这一点,在给定管道
- 步骤1
- 步骤2
2-如果您已经准备好了一个管道,并且只需要在其中附加一个预处理步骤,那么Chain Mapper就会派上用场 我认为它们适用于在作业管道中使用IdentityMapper或IdentityReducer的步骤很少的情况 考虑到这一点,在给定管道中有两个作业步骤:
- 步骤1
- 步骤2