Apache pig 如何使用单个load命令加载不同级别存储的Pig中的特定文件

Apache pig 如何使用单个load命令加载不同级别存储的Pig中的特定文件,apache-pig,Apache Pig,我有下面的文件夹结构 /data/day1/abc.csv /data/day1/def.csv /data/day2/abc.cvs /data/day2/def.csv /data/old/dayxx/abc.csv /data/old/dayxx/def.csv 我无法使用单个pig load命令加载所有abc.csv文件。 如果我使用 它在/data/old/dayxx目录下缺少数据 是否可以使用单个pig load命令加载不同级别的所有abc.csv文件?我认为使用just pig的

我有下面的文件夹结构

/data/day1/abc.csv
/data/day1/def.csv
/data/day2/abc.cvs
/data/day2/def.csv
/data/old/dayxx/abc.csv
/data/old/dayxx/def.csv
我无法使用单个pig load命令加载所有abc.csv文件。 如果我使用

它在/data/old/dayxx目录下缺少数据


是否可以使用单个pig load命令加载不同级别的所有abc.csv文件?

我认为使用just pig的目录结构不可能实现这一点。just pig是什么意思,还可以使用什么?有什么解决方法吗?我的意思是你可以编写一个自定义加载程序UDF,但我认为最好使用多个关系加载不同的文件,或者使用shell脚本(或其他东西)将所有
abc.csv
移动到一个目录下,然后使用pig加载。
LOAD '/data/*/abc.csv' using org.apache.pig.piggybank.storage.CSVExcelStorage()