Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在hadoop map reduce中读取json对象以处理数据_Json_Hadoop_Mapreduce_Bigdata_Jjaql - Fatal编程技术网

在hadoop map reduce中读取json对象以处理数据

在hadoop map reduce中读取json对象以处理数据,json,hadoop,mapreduce,bigdata,jjaql,Json,Hadoop,Mapreduce,Bigdata,Jjaql,我是hadoop的初学者,有人能帮我在mapreduce job中阅读json吗 我在谷歌上搜索过,发现jaql适合阅读json。但我没有找到任何关于如何在我们的MapReduce工作中实现它的文档 是否有其他框架支持在map reduce中读取json 有什么建议吗 提前感谢我宁愿相信MapReduce框架本身能够处理这个问题。MapReduce允许我们编写自定义的Inout/Output格式来处理OOTB不支持的数据,比如JSON。看看这个例子。我更喜欢这个,因为我不需要任何第三方的东西。这

我是hadoop的初学者,有人能帮我在mapreduce job中阅读json吗

我在谷歌上搜索过,发现jaql适合阅读json。但我没有找到任何关于如何在我们的MapReduce工作中实现它的文档

是否有其他框架支持在map reduce中读取json

有什么建议吗


提前感谢

我宁愿相信MapReduce框架本身能够处理这个问题。MapReduce允许我们编写自定义的Inout/Output格式来处理OOTB不支持的数据,比如JSON。看看这个例子。我更喜欢这个,因为我不需要任何第三方的东西。这只是一个扩展MapReduceAPI的问题(但这只是我的选择,其他人可能会发现其他更合适的东西)

但是,IMHO最简单的方法是使用Hive或Pig来处理JSON数据。您不需要做太多的工作就可以让它工作,因为这两个项目都支持OOTB JSON。有关蜂巢JSON SerDe和Pig的JsonLoaderJsonStorage的信息,请参阅


HTH

我在谷歌上搜索并阅读了有关自定义inputformat的内容,但我对如何实现自定义inputformat来解析我的数据完全感到困惑什么是困惑?我的输入数据看起来像{“值”:[{},{},{},{}]},我如何让记录阅读器知道我的json数组中json对象的开始行和结束行?知道吗?我现在面临着同样的困惑。你能告诉我你是怎么做到的吗?