用于读取键值对的Hadoop映射器_Hadoop_Mapreduce

用于读取键值对的Hadoop映射器

hadoop mapreduce

用于读取键值对的Hadoop映射器,hadoop,mapreduce,Hadoop,Mapreduce,是否有内置的InputFormat，我可以在mapper函数中使用它来读取以下格式的输入行： Name [key1#val1,key2#val2,key3#val3,key4#val4] 示例输入数据可能如下所示： sanjose [population#123,area#123,address#1,jkui,ty,tz#PST] delhi [population#1823,area#1023,address#1,jkui,ty,tz#IST] boston [population#1823

是否有内置的InputFormat，我可以在mapper函数中使用它来读取以下格式的输入行：

Name [key1#val1,key2#val2,key3#val3,key4#val4]

示例输入数据可能如下所示：

sanjose [population#123,area#123,address#1,jkui,ty,tz#PST]
delhi [population#1823,area#1023,address#1,jkui,ty,tz#IST]
boston [population#1823,area#1023,address#1,jkui,ty,tz#EST]

设置属性

mapreduce.input.keyvaluelinerecordreader.key.value.separator

并使用

job.setInputFormatClass（KeyValueTextInputFormat.class）
在您的情况下，我相信\t
是键值分隔符
在您的情况下，减速机应该如何工作？与您的格式不同，reducer只能处理键、值对