将pyspark数据帧转换为动态数据帧

将pyspark数据帧转换为动态数据帧,pyspark,aws-glue,pyspark-dataframes,Pyspark,Aws Glue,Pyspark Dataframes,我有一个pyspark数据帧。我能够通过persons.toDF()将动态数据帧转换为spark数据帧。我想在pyspark中将spark数据帧再次转换回动态数据帧。我想将我的列强制转换为时间戳,然后再次将其转换为动态数据帧以解析选项。 请帮助我您可以使用fromDF函数从数据帧创建动态帧 基本语法 dyf = fromDF(dataframe, glue_ctx, name) 在哪里, dataframe–要转换的Apache Spark SQL数据帧(必需) glue_ctx–GlueC

我有一个pyspark数据帧。我能够通过
persons.toDF()
将动态数据帧转换为spark数据帧。我想在pyspark中将spark数据帧再次转换回动态数据帧。我想将我的列强制转换为时间戳,然后再次将其转换为动态数据帧以解析选项。
请帮助我

您可以使用fromDF函数从数据帧创建动态帧

基本语法

dyf = fromDF(dataframe, glue_ctx, name)
在哪里,

  • dataframe–要转换的Apache Spark SQL数据帧(必需)

  • glue_ctx–GlueContext类对象,用于指定此转换的上下文(必需)

  • name–生成的DynamicFrame的名称(必需)


参考资料:

您可以使用fromDF函数从数据帧创建动态帧

基本语法

dyf = fromDF(dataframe, glue_ctx, name)
在哪里,

  • dataframe–要转换的Apache Spark SQL数据帧(必需)

  • glue_ctx–GlueContext类对象,用于指定此转换的上下文(必需)

  • name–生成的DynamicFrame的名称(必需)


参考资料:

至少您需要pyspark.context、awsglue.context和awsglue.dynamicframe 例如:

from pyspark.context import SparkContext
from awsglue.context import GlueContext
from awsglue.dynamicframe import DynamicFrame

sc = SparkContext()
glueContext = GlueContext(sc)

NewDynamicFrame = DynamicFrame.fromDF(persons, glueContext, "nested")
“persons”是您的数据框架

请查看以下链接:


  • 至少您需要pyspark.context、awsglue.context和awsglue.dynamicframe 例如:

    from pyspark.context import SparkContext
    from awsglue.context import GlueContext
    from awsglue.dynamicframe import DynamicFrame
    
    sc = SparkContext()
    glueContext = GlueContext(sc)
    
    NewDynamicFrame = DynamicFrame.fromDF(persons, glueContext, "nested")
    
    “persons”是您的数据框架

    请查看以下链接: