Json 多存储?

Json 多存储?,json,hadoop,apache-pig,Json,Hadoop,Apache Pig,使用Pig0.14,我对以下用例感兴趣:我希望根据它们的键将原始JSON处理到多个输出目录中,并将结果聚合数据存储为JSON。JSON有一个不断发展的动态模式,可以通过elephant bird读入,到目前为止还没有引起任何问题 我可以使用MultiStorage将输出存储在正确的目录中,也可以使用JsonStorage将输出存储为JSON,但不能两者都存储。据我所知,没有公开的UDF可用于此目的 我是否遗漏了一些东西,或者只是为了实现这一点而编写了自己的UDF?这似乎是一个简单的用例,我本以为

使用Pig0.14,我对以下用例感兴趣:我希望根据它们的键将原始JSON处理到多个输出目录中,并将结果聚合数据存储为JSON。JSON有一个不断发展的动态模式,可以通过elephant bird读入,到目前为止还没有引起任何问题

我可以使用MultiStorage将输出存储在正确的目录中,也可以使用JsonStorage将输出存储为JSON,但不能两者都存储。据我所知,没有公开的UDF可用于此目的


我是否遗漏了一些东西,或者只是为了实现这一点而编写了自己的UDF?这似乎是一个简单的用例,我本以为会得到支持。

对于那些正在寻找答案的人;需要自定义项

将JsonStorage和MultiStorage的piggybank udf组合起来创建一个伪JsonMultiStorage类是可能的,而且相对简单