Airflow SparkSubmitoOperator vs SSHOperator,用于提交气流中的pyspark应用程序
我有不同的spark和airflow服务器。我的服务器中没有spark二进制文件。我能够使用SSHOperator并在集群模式下很好地运行spark作业。我想知道从长远来看,使用SSHOperator或SparkSubmitOperator提交pyspark作业有什么好处。如有任何帮助,我们将不胜感激。SparkSubmitOperator是一名专业操作员。也就是说,它应该使提交Spark作业的编写任务更容易,代码本身更可读和可维护。因此,如果可能的话,我会使用它Airflow SparkSubmitoOperator vs SSHOperator,用于提交气流中的pyspark应用程序,airflow,airflow-scheduler,spark-submit,airflow-operator,apache-spark-2.3,Airflow,Airflow Scheduler,Spark Submit,Airflow Operator,Apache Spark 2.3,我有不同的spark和airflow服务器。我的服务器中没有spark二进制文件。我能够使用SSHOperator并在集群模式下很好地运行spark作业。我想知道从长远来看,使用SSHOperator或SparkSubmitOperator提交pyspark作业有什么好处。如有任何帮助,我们将不胜感激。SparkSubmitOperator是一名专业操作员。也就是说,它应该使提交Spark作业的编写任务更容易,代码本身更可读和可维护。因此,如果可能的话,我会使用它 在你的情况下,你应该考虑如果修
在你的情况下,你应该考虑如果修改基础结构,这样你就可以使用SpulkSuiMaultor,这是值得的,我上面提到过。
下面是在空气流中使用SSHORACHVS SPARKPASS运算符的利弊,我的建议如下。 SSHOperator:此操作员将对远程Spark服务器执行SSH操作,并在远程集群中执行Spark提交
优点: