在Hadoop中定制InputFormat_Hadoop_Customization_Key Value

在Hadoop中定制InputFormat

hadoop

在Hadoop中定制InputFormat,hadoop,customization,key-value,Hadoop,Customization,Key Value,我试图从一个非常大的数据库中读取数据，它由地理参考的时间序列数据组成。因此，我有以下格式的文件：经纬度，value@time1,value@time2,....value@timeN. 这是整个地球的数据。现在对于我的工作，我需要得到纬度，经度作为键，时间序列值作为值。据我所知，Hadoop有KeyValueInputFormat，但它认为第一个制表符是分隔符。有没有办法定制它？我需要一个解决方案。玩转 key.value.separator.in.input.line 在作业配置中。

我试图从一个非常大的数据库中读取数据，它由地理参考的时间序列数据组成。因此，我有以下格式的文件：

经纬度，value@time1,value@time2,....value@timeN.

这是整个地球的数据。现在对于我的工作，我需要得到纬度，经度作为键，时间序列值作为值。据我所知，Hadoop有KeyValueInputFormat，但它认为第一个制表符是分隔符。有没有办法定制它？我需要一个解决方案。

玩转

key.value.separator.in.input.line

在作业配置中。

你能指出一个可以帮助我完成这项工作的教程吗。我对这个很陌生，看看这个