Python 从数据帧行创建数据帧

Python 从数据帧行创建数据帧,python,dataframe,pyspark,Python,Dataframe,Pyspark,我正试图在pyspark中保存数据帧中的每一行 我迭代主数据帧,打印行内容,但出现了一个我不知道如何解决的错误 columns = ['name', 'job','date'] for row in data_mail_df.collect(): print(row) df=spark.createDataFrame(row).toDF(*columns) df.show() 这就是我得到的: Row(name=u'alex', job=u'adm

我正试图在pyspark中保存数据帧中的每一行

我迭代主数据帧,打印行内容,但出现了一个我不知道如何解决的错误

columns = ['name', 'job','date']

for row in data_mail_df.collect():
    print(row)
    
    df=spark.createDataFrame(row).toDF(*columns)
    
    df.show()
这就是我得到的:

Row(name=u'alex', job=u'admin', date=u'26.04.2021')
TypeError: Can not infer schema for type: <type 'unicode'>
行(name=u'alex',job=u'admin',date=u'26.04.2021')
TypeError:无法推断类型的架构:
我想为我迭代的每一行保存一个数据帧


非常感谢您的帮助

您为什么要这样做?您将如何处理为每一行创建的数据帧?在循环的每次迭代中,您还将覆盖
df
。这可能是我检查行的名称是否存在于bbdd中,如果不存在,则我将行值保存到另一个bbdd中什么是bbdd@亚历克斯