Hadoop MapReduce作业在10分钟后开始,并有延迟时间

Hadoop MapReduce作业在10分钟后开始,并有延迟时间,hadoop,mapreduce,hive,Hadoop,Mapreduce,Hive,我让这个查询从表中选择COUNT* 当我在Hive中运行此程序时,我会得到如下内容,并且没有作业ID。当我检查正在运行的MapReduce作业时,我看不到任何正在运行的作业。但是,10分钟后,我看到有一个正在运行的作业。我不知道出了什么问题,也不知道如何解决 我希望MapReduce作业在配置单元查询之后立即运行 我在配置单元提示符上看到以下输出: Total MapReduce jobs = 1

我让这个查询从表中选择COUNT*

当我在Hive中运行此程序时,我会得到如下内容,并且没有作业ID。当我检查正在运行的MapReduce作业时,我看不到任何正在运行的作业。但是,10分钟后,我看到有一个正在运行的作业。我不知道出了什么问题,也不知道如何解决

我希望MapReduce作业在配置单元查询之后立即运行

我在配置单元提示符上看到以下输出:

Total MapReduce jobs = 1                                                                                                                                               
Launching Job 1 out of 1                                                                                                                                             
Number of reduce tasks determined at compile time: 1                                                                                                                
In order to change the average load for a reducer (in bytes): set hive.exec.reducers.bytes.per.reducer=<number>                                                                                                                 
In order to limit the maximum number of reducers: set hive.exec.reducers.max=<number>                                                                                                                              
In order to set a constant number of reducers: set mapred.reduce.tasks=<number>  

这听起来很正常。如何检查正在运行的mapreduce作业?ResourceManager web ui中有点滞后。我签入作业跟踪器和命令行日志是否您的mapreduce作业在启动配置单元查询后很晚才运行?如果您在VM中运行配置单元,那么这种行为是正常的,需要一点时间来进行设置和所有操作。另外,如果输入目录有许多小文件,那么设置作业也需要一些时间。我不是在VM上运行的,它在16个集群上运行,输入目录有20个文件,每个50GB