以特定方式取消Pivot PySpark数据帧
我有一个PySpark数据框,看起来像:以特定方式取消Pivot PySpark数据帧,pyspark,Pyspark,我有一个PySpark数据框,看起来像: df2 = spark.createDataFrame([('101', '1', ['a','aa'], ['aa', 'bb']), ('101', '2', ['b','bb'], ['xx', 'yy']), ('101', '10',['c','cc'], ['cc', 'dd']),
df2 = spark.createDataFrame([('101', '1', ['a','aa'], ['aa', 'bb']),
('101', '2', ['b','bb'], ['xx', 'yy']),
('101', '10',['c','cc'], ['cc', 'dd']),
('102', '11',['d','dd'], ['dd', 'ee'])
],
['id', 'other_id', 'col_a', 'col_b']
)
如何取消数据帧的IVOT/转置,使输出看起来像:
我尝试过的解决方案:
我通过以下帖子找到了解决方案: