Dataframe 如何使两列数据框映射类型?
如何使两列数据框映射类型? 我想创建一个包含两列数据帧的贴图类型 -----------------------------结果---------------------------------------------------------------- 地图 ['account'->3,'word1'->2,'word5'->1……] 这是我的密码Dataframe 如何使两列数据框映射类型?,dataframe,dictionary,pyspark,transform,Dataframe,Dictionary,Pyspark,Transform,如何使两列数据框映射类型? 我想创建一个包含两列数据帧的贴图类型 -----------------------------结果---------------------------------------------------------------- 地图 ['account'->3,'word1'->2,'word5'->1……] 这是我的密码 keyword_f = df.filter(month(df['date']) >= 7) \
keyword_f = df.filter(month(df['date']) >= 7) \
.filter(month(df['date']) <= 12) \
.filter(df['statistic_type'] == 'keyword_A') \
.groupby('word').agg(fn.sum('count'))
keyword\u f=df.filter(月(df['date'])>=7)\
.filter(month(df['date'])在您摸索到单词
和计数
之后,您可以通过这种方式收集结果
df.groupBy().agg(map_from_arrays(collect_list('col1'), collect_list('col2')).alias('map')) \
.show(10, False)
+------------------------+
|map |
+------------------------+
|[A -> 1, B -> 2, C -> 3]|
+------------------------+