File io 如何在oozie捆绑包中运行多个协调员
我在oozie包里更新鲜。我想在bundle作业中一个接一个地运行多个协调器。我的要求是在一个协调器作业完成后,将生成成功文件,然后使用该成功文件触发第二个协调器。我不知道该怎么做。为此,我使用了数据依赖技术,它将跟踪先前协调器生成的输出文件。我正在分享一些我试过的代码 假设有两个协调器作业:A和B。我只想触发一个协调器。如果生成了协调器A的成功文件,那么应该只启动协调器B A-coordinator.xmlFile io 如何在oozie捆绑包中运行多个协调员,file-io,dataset,bundle,oozie-coordinator,File Io,Dataset,Bundle,Oozie Coordinator,我在oozie包里更新鲜。我想在bundle作业中一个接一个地运行多个协调器。我的要求是在一个协调器作业完成后,将生成成功文件,然后使用该成功文件触发第二个协调器。我不知道该怎么做。为此,我使用了数据依赖技术,它将跟踪先前协调器生成的输出文件。我正在分享一些我试过的代码 假设有两个协调器作业:A和B。我只想触发一个协调器。如果生成了协调器A的成功文件,那么应该只启动协调器B A-coordinator.xml <workflow> <app-path>${aDi
<workflow>
<app-path>${aDir}/aWorkflow</app-path>
</workflow>
${aDir}/a工作流
这将调用相应的workflow.and _SUCCESS文件是在${aDir}/aWorkflow/final_data/${date}/aDim位置生成的,因此我在
B协调员:
<dataset name="input1" frequency="${freq}" initial-instance="${START_TIME1}" timezone="UTC">
<uri-template>${aDir}/aWorkflow/final_data/${date}/aDim</uri-template>
</dataset>
<done-flag>_SUCCESS</done-flag>
${aDir}/A工作流/最终数据/${date}/aDim
_成功
${START_TIME1}
${bDir}/b工作流
但当我运行它时,第一个协调器会被杀死,但如果我单独运行,它们会成功运行。我不明白为什么这些都会被杀死。
帮助整理我找到了一个简单的方法。我正在共享解决方案。对于coordinator B coordinator.xml,我正在共享。 1) 对于数据集实例,它应该是第二个协调器的开始时间,但不应该是第一个协调器的时间实例。否则,该特定协调器将被终止。 2) 如果您想一个接一个地运行多个协调器,那么还可以在coordinator.xml中包含控件。e、 g.并发、超时或限制。关于这些控件的详细信息可以在“ApacheOozie”一书的第6章中找到。 3) 在“”中,我包含了最新的(0),它将采用上述输出路径中最新生成的文件夹。 4)对于“输入事件”,必须将其名称作为输入输入到${COORD:DATAIN(“ActudiP1”)}。否则OoZIE将不考虑DataSet。p> 30 1. ${aimDir}/aDimWorkflow/final_data/${date}/aDim _成功 ${coord:latest(0)}
${bDir}/b工作流 输入文件 ${coord:dataIn('coordInput1')}
<data-in name="coordInput1" dataset="input1">
<instance>${START_TIME1}</instance>
</data-in>
<workflow>
<app-path>${bDir}/bWorkflow</app-path>
</workflow>