Hadoop 清管器-错误时继续加载

Hadoop 清管器-错误时继续加载,hadoop,apache-pig,hdfs,Hadoop,Apache Pig,Hdfs,猪是新来的 我正在将数据加载到一个关系中,如下所示: raw_data = LOAD '$input_path/abc/def.*; 它工作得很好,但是如果找不到任何与def.*匹配的文件,整个脚本将失败 这是一种在没有匹配项时继续脚本其余部分的方法。只是产生一个空集 我试着做: raw_data = LOAD '$input_path/abc/def.* ONERROR Ignore(); 但这并不解析。不,没有这样的功能,至少我听说过这样的功能。 我还要说,“生成一个空集”就是“根本不运

猪是新来的

我正在将数据加载到一个关系中,如下所示:

raw_data = LOAD '$input_path/abc/def.*;
它工作得很好,但是如果找不到任何与def.*匹配的文件,整个脚本将失败

这是一种在没有匹配项时继续脚本其余部分的方法。只是产生一个空集

我试着做:

raw_data = LOAD '$input_path/abc/def.* ONERROR Ignore();

但这并不解析。

不,没有这样的功能,至少我听说过这样的功能。 我还要说,“生成一个空集”就是“根本不运行脚本”

如果您不想在某些情况下运行Pig脚本,那么我建议使用包装shell脚本或Pig嵌入:

您可以编写一个自定义加载UDF,返回文件或空元组