Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/358.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 将两个动态帧合并/压缩/复制到胶水中_Python_Pyspark_Aws Glue - Fatal编程技术网

Python 将两个动态帧合并/压缩/复制到胶水中

Python 将两个动态帧合并/压缩/复制到胶水中,python,pyspark,aws-glue,Python,Pyspark,Aws Glue,我正在进行一个简单的ETL过程,该过程将从am AWS RDS(postgres)中提取某些列。主要的挑战是,大多数信息都以简单字符串的形式存在于一个“json列”中 我目前的做法: #设置胶水并获取RDS glueContext=glueContext(SparkContext.getOrCreate()) df=glueContext。从目录(database=“db”,table\u name=“table”)创建动态框架 #去田里 sel_df=df。选择_字段([“常规”、“bigjs

我正在进行一个简单的ETL过程,该过程将从am AWS RDS(postgres)中提取某些列。主要的挑战是,大多数信息都以简单字符串的形式存在于一个“json列”中

我目前的做法:

#设置胶水并获取RDS
glueContext=glueContext(SparkContext.getOrCreate())
df=glueContext。从目录(database=“db”,table\u name=“table”)创建动态框架
#去田里
sel_df=df。选择_字段([“常规”、“bigjson”])
#解压缩json
json_df=sel_df.unbox(“bigjson”,“json”)
#从json获取我们需要的字段
json_fields=json_df。选择_字段([“A”、“B”、“C”])
#想做这样的事吗
final_df=sel_df。选择_字段([“常规”])
final_df=final_df.merge(json_字段,vertical=true)#复制列
到目前为止,这是可行的。现在我想使用DF json_字段和sel_DF中的列创建一个新的动态框架。这应该是可能的,因为到目前为止,我的转换没有改变行数

问题:

  • 有没有办法把它们复制在一起

您是否尝试了mergeDynamicFrame方法?