Apache spark oozie属性文件,其中列表作为单个键的值
我有一个spark应用程序,我用命令运行它Apache spark oozie属性文件,其中列表作为单个键的值,apache-spark,oozie,Apache Spark,Oozie,我有一个spark应用程序,我用命令运行它 /usr/hdp/spark2-client/bin/spark-submit \ --name 'App' \ --class 'someFolder.SomeApp \ --master "yarn" \ --deploy-mode "cluster" \ --num-executors 4 \ --executor-cores 3 \ --executor-memory 4g \ --conf spark.sql.
/usr/hdp/spark2-client/bin/spark-submit \
--name 'App' \
--class 'someFolder.SomeApp \
--master "yarn" \
--deploy-mode "cluster" \
--num-executors 4 \
--executor-cores 3 \
--executor-memory 4g \
--conf spark.sql.shuffle.partitions=10 \
--conf spark.default.parallelism=10 \
--files 'hdfs:///file1','hdfs:///file2' \
'assembly-0.25.0-3-ge05360d.jar' \
'param1' 'param2'
但现在我想在oozie运行它。我的问题是-我如何在job.properties文件中表示文件列表中的-files这样的参数?一种方法是将所有这些放在一个shell脚本中,并从oozie调用shell脚本来启动spark应用程序,当然,将shell脚本移动到某个hdfs位置 使用此链接将文件复制到容器: 如果上述方法不起作用, -档案hdfs:///file1','hdfs:///file2' 在shell中,脚本应该可以工作 在spark应用程序日志中,始终查看容器的内容,以确保将所需文件复制到容器中
试试看。如果您运行oozie action shell,那么:
<file>hdfs:///file1#file1</file>
<file>hdfs:///file2#file2</file>
-executor内存XG-num executors Y-files有什么问题hdfs://complete hdfs路径?能否向我们展示您的属性在job.properties中的外观?我认为@Гааааanswer将使用文件标记完成这项工作。