Hadoop中RecordReader的工作原理_Hadoop_Mapreduce

Hadoop中RecordReader的工作原理

hadoop mapreduce

Hadoop中RecordReader的工作原理,hadoop,mapreduce,Hadoop,Mapreduce,有人能解释一下RecordReader是如何工作的吗？程序开始执行后，nextkeyvalue（）、getCurrentkey（）和getprogress（）方法如何工作？（新API）：默认映射器类有一个运行方法，如下所示： public void run(Context context) throws IOException, InterruptedException { setup(context); while (context.nextKeyValue()) {

有人能解释一下RecordReader是如何工作的吗？程序开始执行后，

nextkeyvalue（）

、

getCurrentkey（）

和

getprogress（）

方法如何工作？

（新API）：默认映射器类有一个运行方法，如下所示：

public void run(Context context) throws IOException, InterruptedException {
    setup(context);
    while (context.nextKeyValue()) {
        map(context.getCurrentKey(), context.getCurrentValue(), context);
    }
    cleanup(context);
}

Context.nextKeyValue（）

、

Context.getCurrentKey（）

和

Context.getCurrentValue（）

方法是

RecordReader

方法的包装器。请参阅源文件

src/mapred/org/apache/hadoop/mapreduce/MapContext.java

因此，这个循环执行并调用映射器实现的

map（K，V，Context）

方法

具体来说，您还想知道什么？

org.apache.hadoop.mapred.MapTask -runNewMapper（）

Imp步骤：

创建新的映射器

获取映射器的输入拆分

获取用于拆分的recordreader

初始化记录读取器

使用记录读取器迭代getNextKeyVal（）并将key、val传递给mappers映射方法

清理

@克丽丝……这很有帮助。。。。。你们能解释一下在recordreader中出现的拆分和记录吗？我很困惑…拆分是由InputFormat创建的，并且是从您传入的输入文件派生的，无论输入文件本身是否可拆分，以及您传递的其他选项（如max/min split sizeEach split），然后处理以生成传递到映射的记录method@Chris.. 非常感谢…现在我清楚了。。。。嘿，我需要另一个帮助。。你能帮我解决这个问题吗。。thnx..那么getProgress（）呢？