Hadoop MapReduce作业在10分钟后开始，并有延迟时间_Hadoop_Mapreduce_Hive

Hadoop MapReduce作业在10分钟后开始，并有延迟时间

hadoop mapreduce hive

Hadoop MapReduce作业在10分钟后开始，并有延迟时间,hadoop,mapreduce,hive,Hadoop,Mapreduce,Hive,我让这个查询从表中选择COUNT* 当我在Hive中运行此程序时，我会得到如下内容，并且没有作业ID。当我检查正在运行的MapReduce作业时，我看不到任何正在运行的作业。但是，10分钟后，我看到有一个正在运行的作业。我不知道出了什么问题，也不知道如何解决我希望MapReduce作业在配置单元查询之后立即运行我在配置单元提示符上看到以下输出： Total MapReduce jobs = 1

我让这个查询从表中选择COUNT*

当我在Hive中运行此程序时，我会得到如下内容，并且没有作业ID。当我检查正在运行的MapReduce作业时，我看不到任何正在运行的作业。但是，10分钟后，我看到有一个正在运行的作业。我不知道出了什么问题，也不知道如何解决

我希望MapReduce作业在配置单元查询之后立即运行

我在配置单元提示符上看到以下输出：

Total MapReduce jobs = 1                                                                                                                                               
Launching Job 1 out of 1                                                                                                                                             
Number of reduce tasks determined at compile time: 1                                                                                                                
In order to change the average load for a reducer (in bytes): set hive.exec.reducers.bytes.per.reducer=<number>                                                                                                                 
In order to limit the maximum number of reducers: set hive.exec.reducers.max=<number>                                                                                                                              
In order to set a constant number of reducers: set mapred.reduce.tasks=<number>

这听起来很正常。如何检查正在运行的mapreduce作业？ResourceManager web ui中有点滞后。我签入作业跟踪器和命令行日志是否您的mapreduce作业在启动配置单元查询后很晚才运行？如果您在VM中运行配置单元，那么这种行为是正常的，需要一点时间来进行设置和所有操作。另外，如果输入目录有许多小文件，那么设置作业也需要一些时间。我不是在VM上运行的，它在16个集群上运行，输入目录有20个文件，每个50GB