Apache spark oozie属性文件,其中列表作为单个键的值

Apache spark oozie属性文件,其中列表作为单个键的值,apache-spark,oozie,Apache Spark,Oozie,我有一个spark应用程序,我用命令运行它 /usr/hdp/spark2-client/bin/spark-submit \ --name 'App' \ --class 'someFolder.SomeApp \ --master "yarn" \ --deploy-mode "cluster" \ --num-executors 4 \ --executor-cores 3 \ --executor-memory 4g \ --conf spark.sql.

我有一个spark应用程序,我用命令运行它

/usr/hdp/spark2-client/bin/spark-submit \
  --name 'App' \
  --class 'someFolder.SomeApp \
  --master "yarn" \
  --deploy-mode "cluster" \
  --num-executors 4 \
  --executor-cores 3 \
  --executor-memory 4g \
  --conf spark.sql.shuffle.partitions=10 \
  --conf spark.default.parallelism=10 \
  --files 'hdfs:///file1','hdfs:///file2' \
  'assembly-0.25.0-3-ge05360d.jar' \
  'param1' 'param2'

但现在我想在oozie运行它。我的问题是-我如何在job.properties文件中表示文件列表中的-files这样的参数?

一种方法是将所有这些放在一个shell脚本中,并从oozie调用shell脚本来启动spark应用程序,当然,将shell脚本移动到某个hdfs位置

使用此链接将文件复制到容器:

如果上述方法不起作用, -档案hdfs:///file1','hdfs:///file2' 在shell中,脚本应该可以工作

在spark应用程序日志中,始终查看容器的内容,以确保将所需文件复制到容器中


试试看。

如果您运行oozie action shell,那么:

<file>hdfs:///file1#file1</file>
<file>hdfs:///file2#file2</file>

-executor内存XG-num executors Y-files有什么问题hdfs://complete hdfs路径?能否向我们展示您的属性在job.properties中的外观?我认为@Гааааanswer将使用文件标记完成这项工作。