Hadoop 运行时清管器脚本
我想知道如何写一个动态的拉丁猪脚本 例如,我想获得一个学生列表,并将每个学生的名字传递给Hadoop 运行时清管器脚本,hadoop,apache-pig,Hadoop,Apache Pig,我想知道如何写一个动态的拉丁猪脚本 例如,我想获得一个学生列表,并将每个学生的名字传递给FILTER命令 如下图所示: B = FOREACH A GENERATE STUDENT_NAME; C = FILTER B BY STUDENT_NAME matches RESULT_OF_B; 有点不清楚你在问什么。。。你能试着给出你想要达到的目标的更多细节吗?因为从你刚才所说的来看,你所需要的只是一个连接…所以“RESULT_of_B”在脚本中必须是动态的?是的,Sras。你是对的……但是你
FILTER
命令
如下图所示:
B = FOREACH A GENERATE STUDENT_NAME;
C = FILTER B BY STUDENT_NAME matches RESULT_OF_B;
有点不清楚你在问什么。。。你能试着给出你想要达到的目标的更多细节吗?因为从你刚才所说的来看,你所需要的只是一个连接…所以“RESULT_of_B”在脚本中必须是动态的?是的,Sras。你是对的……但是你在B的
结果中有什么样的数据呢?是亲戚吗?你想要实现什么?那么你想要的是一个JOIN
。使用X=JOIN A BY(学生名),SECOND\u relations BY(学生名)
。这样,您将只获得学生姓名与B
中的记录匹配的第二个关系中的记录。