Hadoop Oozie输出事件

Hadoop Oozie输出事件,hadoop,mapreduce,oozie,oozie-coordinator,Hadoop,Mapreduce,Oozie,Oozie Coordinator,我不明白Ozzie中输出事件的用途是什么。Ozzie文档声明“协调器操作可以生成一个或多个数据集实例作为输出”,但没有给出任何实际细节或示例。生成数据集实例作为输出意味着什么?这是否意味着Ozzie将通过数据集的URI模板创建一个文件夹作为输出?我真的不明白为什么我应该使用输出evets 谢谢 如果您谈论的是Oozie,则输出文件用于连接不同的协调器作业。考虑一个大的协调器作业DAG,一些作业可能把其他作业的输出作为输入。因此,数据集是DAG中的边 例如,在Oozie配置文件中,如果指定协调器A

我不明白Ozzie中输出事件的用途是什么。Ozzie文档声明“协调器操作可以生成一个或多个数据集实例作为输出”,但没有给出任何实际细节或示例。生成数据集实例作为输出意味着什么?这是否意味着Ozzie将通过数据集的URI模板创建一个文件夹作为输出?我真的不明白为什么我应该使用输出evets


谢谢

如果您谈论的是Oozie,则输出文件用于连接不同的协调器作业。考虑一个大的协调器作业DAG,一些作业可能把其他作业的输出作为输入。因此,数据集是DAG中的边


例如,在Oozie配置文件中,如果指定协调器A的输出为DS1,协调器B的输出为DS2,协调器C的输入为DS1和DS2,则Oozie将保证在DS1和DS2准备就绪之前不会执行协调器C中的相应操作

在协调器中至少有一种指定
的用法。在为一系列日期重新运行协调器时(使用
oozie job-rerun
命令),将删除指定为
s的所有相应路径


有时,删除协调器实例生成的所有输出非常有用。例如,当您希望启动另一个协调器,该协调器的路径为
s,并且您希望确保它将处理重新运行的数据,而不是旧数据

谢谢你的回答。但我仍然不明白协调器XML中节点的实际用途是什么。在您的示例中,您实际上描述了对输入事件的需求。在您的示例中,哪里需要输出事件?因为即使我不分别在协调器A和B中指定DS1和DS2,协调器C仍然依赖于DS1和DS2,因为它们可能在其输入事件中声明。那么,输出事件节点的实际用途(而不仅仅是名义用途)是什么呢?谢谢:)