Hadoop 在执行配置单元查询时分配了多少映射器和还原器

Hadoop 在执行配置单元查询时分配了多少映射器和还原器,hadoop,mapreduce,hive,Hadoop,Mapreduce,Hive,执行配置单元查询时,将执行多少映射器/还原器,或者在执行配置单元查询时,如何确定将如何执行man映射器和还原器?映射器的数量取决于jobclient计算的输入拆分的数量 而配置单元查询就像一系列的Map-reduce作业。如果您编写一个简单的查询,如选择Count(*)from Employee只会执行一个Map reduce程序。如果给出一个包含大量聚合和联接等的复杂查询,将执行一系列Map Reduce程序,该程序使用早期MR阶段输出作为下一个MR阶段的输入,最终结果将转储到HDFS中 开发

执行配置单元查询时,将执行多少映射器/还原器,或者在执行配置单元查询时,如何确定将如何执行man映射器和还原器?

映射器的数量取决于jobclient计算的输入拆分的数量

而配置单元查询就像一系列的Map-reduce作业。如果您编写一个简单的查询,如
选择Count(*)from Employee
只会执行一个Map reduce程序。如果给出一个包含大量聚合和联接等的复杂查询,将执行一系列Map Reduce程序,该程序使用早期MR阶段输出作为下一个MR阶段的输入,最终结果将转储到HDFS中


开发者可以在Hive Shell中将还原器的数量设置为映射。reduce.tasks=x

您能告诉我一些文档/架构或流程图吗。这样我就可以更好地理解配置单元查询的内部工作。