Apache spark “如何解决错误”;属性错误:';SparkSession';对象没有属性';序列化程序';?

Apache spark “如何解决错误”;属性错误:';SparkSession';对象没有属性';序列化程序';?,apache-spark,pyspark,pyspark-sql,Apache Spark,Pyspark,Pyspark Sql,我正在使用pyspark数据帧。我有一些代码试图将dataframe转换为rdd,但收到以下错误: AttributeError:“SparkSession”对象没有属性“serializer” 问题是什么 training, test = rescaledData.randomSplit([0.8, 0.2]) nb = NaiveBayes(smoothing=1.0, modelType="multinomial") # Train a naive Bayes model. model =

我正在使用pyspark数据帧。我有一些代码试图将
dataframe
转换为
rdd
,但收到以下错误:

AttributeError:“SparkSession”对象没有属性“serializer”

问题是什么

training, test = rescaledData.randomSplit([0.8, 0.2])
nb = NaiveBayes(smoothing=1.0, modelType="multinomial")
# Train a naive Bayes model.
model = nb.fit(rescaledData)

# Make prediction and test accuracy.
predictionAndLabel = test.rdd.map(lambda p: (model.predict(p.features), p.label))
accuracy = 1.0 * predictionAndLabel.filter(lambda pl: pl[0] == pl[1]).count() / test.count()
print('model accuracy {}'.format(accuracy))
有人知道为什么语句
test.rdd
会导致错误吗?数据框包含(标签、特征)的
行对象

谢谢