Dataframe Pypark AttributeError:';数据帧';对象没有属性';toDF&x27;

Dataframe Pypark AttributeError:';数据帧';对象没有属性';toDF&x27;,dataframe,pyspark,Dataframe,Pyspark,下面的代码以前对我有用,但现在不行了。我得到了一个错误: AttributeError:“DataFrame”对象没有属性“toDF” 我想出来了。看来这和我们的spark版本有关。如果您使用的是spark版本1.6,则使用该代码将rdd转换为df from pyspark.sql import SQLContext, Row sqlContext = SQLContext(sc) df = sqlContext.createDataFrame(rdd) 如果要为行指定标题,请使用此选项 df

下面的代码以前对我有用,但现在不行了。我得到了一个错误:

AttributeError:“DataFrame”对象没有属性“toDF”


我想出来了。看来这和我们的spark版本有关。如果您使用的是spark版本1.6,则使用该代码将rdd转换为df

from pyspark.sql import SQLContext, Row
sqlContext = SQLContext(sc)
df = sqlContext.createDataFrame(rdd)
如果要为行指定标题,请使用此选项

df= rdd.map(lambda p: Row(ip=p[0], time=p[1], zone=p[2]))

在本例中,ip、time、zone是行标题。

您想做什么?将列名分配给数据框可能与我知道的那篇文章重复。我只是觉得“toDF”更方便,而且它以前对我很管用。我想出来了。看来这和我们的spark版本有关。它与1.6兼容。
df= rdd.map(lambda p: Row(ip=p[0], time=p[1], zone=p[2]))