在python中以编程方式提交pyspark作业而不使用submit pyspark_Pyspark_Yarn_Cloudera_Spark Submit

在python中以编程方式提交pyspark作业而不使用submit pyspark

pyspark

在python中以编程方式提交pyspark作业而不使用submit pyspark,pyspark,yarn,cloudera,spark-submit,Pyspark,Yarn,Cloudera,Spark Submit,我想将spark作业从本地系统提交到安装cloudera的远程服务器（spark on Thread）。我已经尝试了所有的可能性正在尝试创建SparkSession和SparkContext 代码如下： (一)-------------------------------------------------- from pyspark import SparkConf, SparkContext from pyspark.sql import SparkSession appName =

我想将spark作业从本地系统提交到安装cloudera的远程服务器（spark on Thread）。我已经尝试了所有的可能性

正在尝试创建SparkSession和SparkContext

代码如下：

(一)--------------------------------------------------

from pyspark import SparkConf, SparkContext
from pyspark.sql import SparkSession

appName = 'TEST_ON_SPARK'
masterUrl = 'yarn'

spark = None
try:
    spark = SparkSession.builder.appName(appName).master(masterUrl).\
    config("spark.hadoop.fs.defaultFS", "hdfs://192.168.XX.XX:8020").\
    config("spark.hadoop.yarn.resourcemanager.address", "192.168.XX.XX:8032").getOrCreate() 

except Exception as e:
    print(e)
    raise e
finally:
    if spark is not None:
        spark.stop()

##################Also, tried


try:
    conf = SparkConf().setAppName(appName).setMaster(masterUrl).\
    set("spark.hadoop.fs.defaultFS", "hdfs://192.168.XX.XX").\
    set("spark.hadoop.yarn.resourcemanager.hostname", "192.168.XX.XX").\
    set("spark.submit.deployMode","cluster").\
    set("spark.hadoop.yarn.resourcemanager.address", "192.168.XX.XX:8032").\
    set("spark.hadoop.yarn.resourcemanager.hostname", "resourcemanager.192.168.XX.XX").\
    set("spark.yarn.access.namenodes", "hdfs://192.168.XX.XX:8020,hdfs://192.168.XX.XX:8020").\
    set("spark.yarn.stagingDir", "hdfs://192.168.XX.XX:8020/user/username.surname/")
    for i in conf.getAll():
        print(i)
    print(1)
    sparkContext = SparkContext(conf=conf)
    print(2)
    spark = SparkSession.builder.config(conf=conf).getOrCreate()
except Exception as e:
    print(e)
    raise e
finally:
    if spark is not None:
        spark.stop()
    if sparkContext is not None:
        sparkContext.stop()

目前，spark submit是以编程方式提交作业的方法