Apache spark Hortonworks Oozie火花行动
有没有人通过HDP中的Oozie成功运行Spark操作 我正在用Oozie 4.2.0运行HDP2.3.2。火花动作设置为在纱线簇模式下运行。spark作业是一个虚拟作业,没有输入文件 我首先发现了错误,并通过从hdfs oozie spark lib文件夹中删除以下内容(在我的示例中:Apache spark Hortonworks Oozie火花行动,apache-spark,oozie,hortonworks-data-platform,Apache Spark,Oozie,Hortonworks Data Platform,有没有人通过HDP中的Oozie成功运行Spark操作 我正在用Oozie 4.2.0运行HDP2.3.2。火花动作设置为在纱线簇模式下运行。spark作业是一个虚拟作业,没有输入文件 我首先发现了错误,并通过从hdfs oozie spark lib文件夹中删除以下内容(在我的示例中:/user/oozie/share/lib/lib_2015111201309/spark/)绕过了错误: 速子-0.5.0.jar tachyon-client-0.5.0.jar(都是因为错误) spark
/user/oozie/share/lib/lib_2015111201309/spark/
)绕过了错误:
- 速子-0.5.0.jar
- tachyon-client-0.5.0.jar(都是因为错误)
- spark-core_2.10-1.1.0.jar
- spark-graphx_2.10-1.1.0.jar
- spark-streaming_2.10-1.1.0.jar
- datanucleus-api-jdo-3.2.6.jar
- datanucleus-core-3.2.10.jar
- datanucleus-rdbms-3.2.9.jar
- spark-1.4.1.2.3.2.0-2950-Thread-shuffle.jar
- spark-assembly-1.4.1.2.3.2.0-2950-hadoop2.7.1.2.3.2.0-2950.jar
- spark-examples-1.4.1.2.3.2.0-2950-hadoop2.7.1.2.3.2.0-2950.jar
- 在job.properties文件和纱线配置文件中,作业跟踪器/资源管理器端口均设置为8032
- 应用程序运行了约20分钟(我运行了多次并观察到了这个时间)
- 备份Oozie sharelib spark文件夹,并删除除
Oozie sharelib-.jar之外的所有jar。在我的例子中,我只是将spark文件夹重命名为
,并创建了一个新的spark backup
文件夹,然后复制了我提到的jarspark
- 将所有JAR从
复制到Oozie sharelib SPARK文件夹$SPARK_HOME/lib
- 重新启动Oozie
- 通过Ambari将warn.resourcemanager.address更改为
:8032
- 再生纱
- 以下是我为让SparkAction在HDP2.3.4上工作而执行的步骤
我以前也遇到过类似的问题,所以我在Hortonworks社区上发布了这篇文章,这是帮助我最终让它工作的原因。你能告诉我们你尝试了什么吗?你正在使用哪个版本的HDP?您尝试了什么,遇到了什么错误?@PeterSmith我添加了更多信息,谢谢you@TonTorres我添加了更多信息,谢谢你,不用重新启动服务,你可以使用CLI“重新同步”ShareLib-谢谢Samson,我不知道。