如何在oozie工作流中使用内部cloudera JAR

如何在oozie工作流中使用内部cloudera JAR,jar,cloudera,oozie,bigdata,Jar,Cloudera,Oozie,Bigdata,当运行各种oozie操作时,我需要一些与cloudera一起安装的基本JAR(我知道它们存在于集群中) 例如,在运行pig操作时,我需要一个piggybank.jar,我希望使用cloudera提供的内部jar,而不是将重复的jar添加到我的客户lib目录中 问题是如何在pig、bash脚本中使用(引用)这些内部jar?pig文档说明,您可以使用sthg启动脚本,比如REGISTER/opt/cloudera/parcels/CDH/wtf/pig/duh/blahblah/pigswaveng

当运行各种oozie操作时,我需要一些与cloudera一起安装的基本JAR(我知道它们存在于集群中)

例如,在运行pig操作时,我需要一个piggybank.jar,我希望使用cloudera提供的内部jar,而不是将重复的jar添加到我的客户lib目录中


问题是如何在pig、bash脚本中使用(引用)这些内部jar?

pig文档说明,您可以使用sthg启动脚本,比如
REGISTER/opt/cloudera/parcels/CDH/wtf/pig/duh/blahblah/pigswavengs.jar以便Java“类加载器”将该JAR动态添加到类路径中。假设您知道安装在所有DataNodes上的JAR的确切名称。是的,但我想要更通用的解决方案,这些cloudera可能位于不同的位置,具体取决于集群环境。我知道cloudera将通用类路径公开给带有JAR的目录,但我不知道如何在脚本中使用它们