Hadoop 如何处理pig中的重复代码(模块化)

Hadoop 如何处理pig中的重复代码(模块化),hadoop,apache-pig,Hadoop,Apache Pig,我有一个pig代码,可以这样做 连接到db1、do、连接到db2并执行相同的操作 合并输出以生成最终输出 基本上如何处理脚本中多个位置需要相同代码的情况您可以为重复操作定义宏,并在pig脚本中使用这些宏,如下所示: DEFINE macroPerformUnion() RETURNS union_data { union_data = -- do your stuff } 将以上内容保存在一个文件中,文件名为macroPerformUnion.pig 现在要在脚本中使用宏,需要导入p

我有一个pig代码,可以这样做

连接到db1、do、连接到db2并执行相同的操作

合并输出以生成最终输出



基本上如何处理脚本中多个位置需要相同代码的情况

您可以为重复操作定义宏,并在pig脚本中使用这些宏,如下所示:

DEFINE macroPerformUnion() RETURNS union_data {
    union_data = -- do your stuff
}
将以上内容保存在一个文件中,文件名为macroPerformUnion.pig

现在要在脚本中使用宏,需要导入pig文件

IMPORT 'macroPerformUnion.pig';
现在您可以使用

union_data_result = macroPerformUnion();

您可以为重复操作定义宏,并在pig脚本中使用这些宏,如下所示:

DEFINE macroPerformUnion() RETURNS union_data {
    union_data = -- do your stuff
}
将以上内容保存在一个文件中,文件名为macroPerformUnion.pig

现在要在脚本中使用宏,需要导入pig文件

IMPORT 'macroPerformUnion.pig';
现在您可以使用

union_data_result = macroPerformUnion();