Apache spark pyspark api调用的内容要求在客户机模式下的workers中使用相同版本的python_Apache Spark_Pyspark_Pyspark Sql

Apache spark pyspark api调用的内容要求在客户机模式下的workers中使用相同版本的python

apache-spark pyspark

Apache spark pyspark api调用的内容要求在客户机模式下的workers中使用相同版本的python,apache-spark,pyspark,pyspark-sql,Apache Spark,Pyspark,Pyspark Sql,通常，我在驱动程序中使用不同版本的Python运行代码，而不是在工作节点中，使用Thread客户端模式例如，我通常在驱动程序中使用python3.5，在workers中使用默认的python2.6，这非常有效我目前在一个项目中，我们需要打电话 sqlContext.createDataFrame 但这似乎试图在workers中用python执行这句话，然后我得到了在workers中安装相同版本python的要求，这正是我试图避免的那么，对于使用“sqlContext.createData

通常，我在驱动程序中使用不同版本的Python运行代码，而不是在工作节点中，使用Thread客户端模式

例如，我通常在驱动程序中使用python3.5，在workers中使用默认的python2.6，这非常有效

我目前在一个项目中，我们需要打电话

sqlContext.createDataFrame

但这似乎试图在workers中用python执行这句话，然后我得到了在workers中安装相同版本python的要求，这正是我试图避免的

那么，对于使用“sqlContext.createDataFrame”，驱动程序和工作程序中需要有相同的python版本吗

如果是这样的话，还有哪一个“纯”pyspark.sql api调用也有此要求

谢谢，何塞

是的，通常需要相同的Python版本。某些API调用可能不会失败，因为没有使用Python执行器，但它不是有效的配置
与Python代码交互的每个调用，如
```
udf
```
或
```
DataFrame.rdd.*
```
都会触发相同的异常
如果要避免升级集群Python，请在驱动程序上使用Python 2

是的，通常需要相同的Python版本。某些API调用可能不会失败，因为没有使用Python执行器，但它不是有效的配置
与Python代码交互的每个调用，如
```
udf
```
或
```
DataFrame.rdd.*
```
都会触发相同的异常
如果要避免升级集群Python，请在驱动程序上使用Python 2