使用pig分析twitter提要中的json

使用pig分析twitter提要中的json,json,apache-pig,Json,Apache Pig,我已经下载了1GB的推文,并希望使用pig分析相同的推文,我如何使用pig阅读推文的json格式,我正在学习pig,任何指针都会有巨大的帮助。 人们谈论使用PigJsonLoader(),但这不是piggybank的一部分。为什么您必须使用piggybank?您可以使用ElephantBird的com.twitter.ElephantBird.pig.piggybank.JsonStringToMap,它可以帮助您更动态地完成任务。它不会解决你所有的问题(例如包),但很容易使用。我能够找到方法,

我已经下载了1GB的推文,并希望使用pig分析相同的推文,我如何使用pig阅读推文的json格式,我正在学习pig,任何指针都会有巨大的帮助。
人们谈论使用PigJsonLoader(),但这不是piggybank的一部分。

为什么您必须使用piggybank?您可以使用ElephantBird的com.twitter.ElephantBird.pig.piggybank.JsonStringToMap,它可以帮助您更动态地完成任务。它不会解决你所有的问题(例如包),但很容易使用。

我能够找到方法,A=LOAD'tweets.json'使用JsonLoader('创建地址:chararray,文本:chararray,id:chararray,id_str:chararray')。。但是还没有完全解决这个问题,因为我想从tweet中选择一些特定的字段,所以我不想指定模式中的每个字段