在Hadoop中定制InputFormat

在Hadoop中定制InputFormat,hadoop,customization,key-value,Hadoop,Customization,Key Value,我试图从一个非常大的数据库中读取数据,它由地理参考的时间序列数据组成。因此,我有以下格式的文件: 经纬度,value@time1,value@time2,....value@timeN. 这是整个地球的数据。 现在对于我的工作,我需要得到纬度,经度作为键,时间序列值作为值。 据我所知,Hadoop有KeyValueInputFormat,但它认为第一个制表符是分隔符。 有没有办法定制它?我需要一个解决方案。玩转 key.value.separator.in.input.line 在作业配置中。

我试图从一个非常大的数据库中读取数据,它由地理参考的时间序列数据组成。因此,我有以下格式的文件:

经纬度,value@time1,value@time2,....value@timeN.

这是整个地球的数据。 现在对于我的工作,我需要得到纬度,经度作为键,时间序列值作为值。 据我所知,Hadoop有KeyValueInputFormat,但它认为第一个制表符是分隔符。 有没有办法定制它?我需要一个解决方案。

玩转

key.value.separator.in.input.line

在作业配置中。

你能指出一个可以帮助我完成这项工作的教程吗。我对这个很陌生,看看这个