TaskStatus类中Hadoop的getProgress()方法是什么?

TaskStatus类中Hadoop的getProgress()方法是什么?,hadoop,mapreduce,Hadoop,Mapreduce,TaskStatus类有一个getProgress方法,但我不确定这个方法实际返回什么 是花费的时间还是处理的输入数据 我想知道到目前为止源代码中处理了多少数据。我该怎么办?我应该使用getProgress吗?这是来自 获取当前进度 返回:一个介于0.0和1.0之间(含0.0和1.0)的数字,指示尝试的进度 尝试在此处成为mapreduce作业。如何获取每个map或reduce任务的输入数据大小?@mndn我不知道有任何函数可以计算精确大小,但是,对于mapper,输入数据的大小将始终小于可使用

TaskStatus类有一个getProgress方法,但我不确定这个方法实际返回什么

是花费的时间还是处理的输入数据


我想知道到目前为止源代码中处理了多少数据。我该怎么办?我应该使用getProgress吗?

这是来自

获取当前进度

返回:一个介于0.0和1.0之间(含0.0和1.0)的数字,指示尝试的进度


尝试在此处成为mapreduce作业。

如何获取每个map或reduce任务的输入数据大小?@mndn我不知道有任何函数可以计算精确大小,但是,对于mapper,输入数据的大小将始终小于可使用FileInputFormat计算的拆分大小。computeSplitSizeTaskStatus类具有方法getPhase。它返回什么?它们只是映射、洗牌、排序、减少吗?@mndn它可以返回从开始、映射、洗牌、排序、减少到清理的任何内容,具体取决于当前阶段(即枚举)。我需要在Defualt投机者中调用FileInputFormat.computeSplitSize。java,它需要k,v FileInputFormat。我如何才能做到这一点?