Java MapReduce体系结构设计中的自定义注释

Java MapReduce体系结构设计中的自定义注释,java,hadoop,mapreduce,annotations,Java,Hadoop,Mapreduce,Annotations,我们需要设计MapReduce架构,使其不依赖于输入模式。将存在MapReduce代码保持不变的技术/逻辑,对输入模式的更改将仅由自定义可配置逻辑管理。我们可以使用自定义注释来实现这一点,或者有更好的方法来实现这一点 任何建议都会大有帮助。非常感谢。这已经是MapReduce的一项功能,这要归功于FileInputFormat和RecordReader。在这里,我不能给出比这更好的例子,但本质上,这两个类不涉及核心映射和reduce逻辑。FileInputFormat负责读取和解析输入数据,然后

我们需要设计MapReduce架构,使其不依赖于输入模式。将存在MapReduce代码保持不变的技术/逻辑,对输入模式的更改将仅由自定义可配置逻辑管理。我们可以使用自定义注释来实现这一点,或者有更好的方法来实现这一点


任何建议都会大有帮助。非常感谢。

这已经是MapReduce的一项功能,这要归功于FileInputFormat和RecordReader。在这里,我不能给出比这更好的例子,但本质上,这两个类不涉及核心映射和reduce逻辑。FileInputFormat负责读取和解析输入数据,然后将这些数据传递给RecordReader,RecordReader为映射器提供单键值对


因此,映射程序实际上不知道它的键值对来自何处,也不知道它是如何到达那里的,因为context.getInputSplit不完全正确。这意味着您可以在同一个作业中混合和匹配输入类型,尽管每个映射器只能有一个FileInputFormat,但您可以使用多个不同的映射器,它们下面有相同的POJO。

感谢您的回复。对于FileInputFormat和RecordReader,我们有任何注释格式吗?我们希望MR逻辑仅用于文件处理,所有输入更改都需要通过自定义注释处理,就像属性一样,可以根据需要进行更改。