Hadoop 如何使用XMLLoader将文件名合并到Pig拉丁语脚本中?

Hadoop 如何使用XMLLoader将文件名合并到Pig拉丁语脚本中?,hadoop,apache-pig,hadoop-streaming,Hadoop,Apache Pig,Hadoop Streaming,我使用XMLLoader在我的pig拉丁语脚本中加载XML,然后用我的UDF解析它。 问题是我想将输入文件名合并到我的UDF中 差不多 fileName=Stringinput.get1 这是我的猪拉丁代码供参考 REGISTER contrib/piggybank/java/piggybank.jar; REGISTER TallyUDF.jar; log = LOAD '/home/HadoopNaman1/pig/trunk/CompFetXML.xml' using org.apach

我使用XMLLoader在我的pig拉丁语脚本中加载XML,然后用我的UDF解析它。 问题是我想将输入文件名合并到我的UDF中

差不多

fileName=Stringinput.get1

这是我的猪拉丁代码供参考

REGISTER contrib/piggybank/java/piggybank.jar;
REGISTER TallyUDF.jar;
log = LOAD '/home/HadoopNaman1/pig/trunk/CompFetXML.xml' using  org.apache.pig.piggybank.storage..XMLLoader('ENVELOPE') as xml_record;
N = FOREACH log GENERATE FLATTEN(TallyUDF.ParseCompFet(xml_record)) as (key:CHARARRAY,value1:CHARARRAY,value2:CHARARRAY);
M = FILTER N by key is not null;
DUMP M;

我想我必须编辑XMLLoader.java代码。但是,我想不出怎么做。

这个答案可能会让您知道怎么做: