Apache pig Json加载程序的模式?

Apache pig Json加载程序的模式?,apache-pig,Apache Pig,我有一个json文档。类似于下面的文档 {"sick":["sick","sickness"], "typhoid":["thyphoid A","thyphoid B","typhoid C"]} 如何使用JsonLoader在Pig中加载此文档。这就是我所尝试的: A = LOAD 'd' USING JsonLoader('key:map[]'); 我得到的结果是: Input paths to process : 1 () pig的本机JsonLoader不能很好地处理嵌套数组 对

我有一个json文档。类似于下面的文档

{"sick":["sick","sickness"], "typhoid":["thyphoid A","thyphoid B","typhoid C"]}
如何使用JsonLoader在Pig中加载此文档。这就是我所尝试的:

A = LOAD 'd' USING JsonLoader('key:map[]');
我得到的结果是:

Input paths to process : 1
()

pig的本机JsonLoader不能很好地处理嵌套数组

对于使用嵌套数组加载复杂的JSON,如果您设置大象鸟()JsonLoader,您将有一个更轻松的时间。然后,您可以执行以下操作:

REGISTER '/path/to/elephant-bird.jar';
B = LOAD '/path/to/your/jsonfile.json' USING com.twitter.elephantbird.pig.load.JsonLoader('-nestedLoad');
-nestedLoad标记将处理任何嵌套的JSON数组。您可能还需要注册json_简单库才能使其工作。此外,我建议查看Github存储库中发布的示例,以便更好地了解输出的格式