在hadoop map reduce中读取json对象以处理数据
我是hadoop的初学者,有人能帮我在mapreduce job中阅读json吗 我在谷歌上搜索过,发现jaql适合阅读json。但我没有找到任何关于如何在我们的MapReduce工作中实现它的文档 是否有其他框架支持在map reduce中读取json 有什么建议吗在hadoop map reduce中读取json对象以处理数据,json,hadoop,mapreduce,bigdata,jjaql,Json,Hadoop,Mapreduce,Bigdata,Jjaql,我是hadoop的初学者,有人能帮我在mapreduce job中阅读json吗 我在谷歌上搜索过,发现jaql适合阅读json。但我没有找到任何关于如何在我们的MapReduce工作中实现它的文档 是否有其他框架支持在map reduce中读取json 有什么建议吗 提前感谢我宁愿相信MapReduce框架本身能够处理这个问题。MapReduce允许我们编写自定义的Inout/Output格式来处理OOTB不支持的数据,比如JSON。看看这个例子。我更喜欢这个,因为我不需要任何第三方的东西。这
提前感谢我宁愿相信MapReduce框架本身能够处理这个问题。MapReduce允许我们编写自定义的Inout/Output格式来处理OOTB不支持的数据,比如JSON。看看这个例子。我更喜欢这个,因为我不需要任何第三方的东西。这只是一个扩展MapReduceAPI的问题(但这只是我的选择,其他人可能会发现其他更合适的东西) 但是,IMHO最简单的方法是使用Hive或Pig来处理JSON数据。您不需要做太多的工作就可以让它工作,因为这两个项目都支持OOTB JSON。有关蜂巢JSON SerDe和Pig的JsonLoader和JsonStorage的信息,请参阅
HTH我在谷歌上搜索并阅读了有关自定义inputformat的内容,但我对如何实现自定义inputformat来解析我的数据完全感到困惑什么是困惑?我的输入数据看起来像{“值”:[{},{},{},{}]},我如何让记录阅读器知道我的json数组中json对象的开始行和结束行?知道吗?我现在面临着同样的困惑。你能告诉我你是怎么做到的吗?