通过脚本加载XML
我有一个XML,它是通过Pig脚本加载的,也可以通过Hive读取 如果我在所有标记中都有值,那么上面的过程是有效的,比如 val1val2但如果我的文件看起来像 val1/TAG2>(TAG2不存在值,则输出中不写入任何内容)通过脚本加载XML,xml,apache-pig,Xml,Apache Pig,我有一个XML,它是通过Pig脚本加载的,也可以通过Hive读取 如果我在所有标记中都有值,那么上面的过程是有效的,比如 val1val2但如果我的文件看起来像 val1/TAG2>(TAG2不存在值,则输出中不写入任何内容) 如何更正此问题请详细说明您的问题,将您拥有的脚本和XML数据显示为:XML 1:->aaaaaaaaa zzzzz XML2:->aaaaaaaaa REGISTER piggybank.jar A=LOAD'/test.XML',使用org.apache.pig.pig
如何更正此问题请详细说明您的问题,将您拥有的脚本和XML数据显示为:XML 1:->aaaaaaaaa zzzzz XML2:->aaaaaaaaa REGISTER piggybank.jar A=LOAD'/test.XML',使用org.apache.pig.piggybank.storage.xmloader('HEADER')作为(x:chararray);B=将每个A生成展平(正则表达式提取所有(x,'\\s*(.*)(.*)))作为(TAG1:chararray,TAG2:chararray);使用PigStorage(“|”)将B存储到“/output”中;如果输入了XML1,则正确加载数据;如果使用XML2作为输入,则不会加载任何内容。请编辑您的问题,以添加具有正确格式的脚本和XML数据(请参阅)。很难从注释中读取脚本内容和XML数据