Dataframe 如何使两列数据框映射类型?

Dataframe 如何使两列数据框映射类型?,dataframe,dictionary,pyspark,transform,Dataframe,Dictionary,Pyspark,Transform,如何使两列数据框映射类型? 我想创建一个包含两列数据帧的贴图类型 -----------------------------结果---------------------------------------------------------------- 地图 ['account'->3,'word1'->2,'word5'->1……] 这是我的密码 keyword_f = df.filter(month(df['date']) >= 7) \

如何使两列数据框映射类型?

我想创建一个包含两列数据帧的贴图类型

-----------------------------结果----------------------------------------------------------------

地图 ['account'->3,'word1'->2,'word5'->1……]

这是我的密码

keyword_f = df.filter(month(df['date']) >= 7) \
                    .filter(month(df['date']) <= 12) \
                    .filter(df['statistic_type'] == 'keyword_A') \
                    .groupby('word').agg(fn.sum('count'))
keyword\u f=df.filter(月(df['date'])>=7)\

.filter(month(df['date'])在您摸索到
单词
计数
之后,您可以通过这种方式收集结果

df.groupBy().agg(map_from_arrays(collect_list('col1'), collect_list('col2')).alias('map')) \
  .show(10, False)

+------------------------+
|map                     |
+------------------------+
|[A -> 1, B -> 2, C -> 3]|
+------------------------+