Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/drupal/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Hadoop Amazon Elastic MapReduce:已启动地图任务的数量_Hadoop_Mapreduce - Fatal编程技术网

Hadoop Amazon Elastic MapReduce:已启动地图任务的数量

Hadoop Amazon Elastic MapReduce:已启动地图任务的数量,hadoop,mapreduce,Hadoop,Mapreduce,在MapReduce作业流步骤的“syslog”中,我看到以下内容: Job Counters Launched reduce tasks=4 Launched map tasks=39 启动的映射任务数是否包括失败的任务 我使用NLineInputFormat类作为输入格式来管理地图任务的数量。 但是,对于完全相同的输入,我偶尔会得到稍微不同的数字,或者取决于实例的数量(10、15和20) 谁能告诉我为什么我看到不同数量的任务启动 这很可能是投机性执行。当Hadoop拥有可用资源时,

在MapReduce作业流步骤的“syslog”中,我看到以下内容:

Job Counters
  Launched reduce tasks=4
  Launched map tasks=39
启动的映射任务数是否包括失败的任务

我使用NLineInputFormat类作为输入格式来管理地图任务的数量。 但是,对于完全相同的输入,我偶尔会得到稍微不同的数字,或者取决于实例的数量(10、15和20)


谁能告诉我为什么我看到不同数量的任务启动

这很可能是投机性执行。当Hadoop拥有可用资源时,它可能会选择同时运行同一任务的两次尝试。已启动的任务包括所有已启动的任务,无论这些任务后来是否成功、失败(由于异常)或被终止(由于管理干扰或推测性执行,在“更快”任务完成后终止“较慢”任务)

在两次运行之间,您的总任务-失败-终止可能是相同的

希望这有帮助