在pyspark数据帧中仅提升一列
我有一个pyspark数据帧,如下所示:在pyspark数据帧中仅提升一列,pyspark,Pyspark,我有一个pyspark数据帧,如下所示: Name Family Area age_tier age_tier_num diseases N1 F1 A1 <=10 1 2 N1 F1 A1 11-20 2 3 N1 F1 A1 21-40 3 5 N1 F1 A1 41-80
Name Family Area age_tier age_tier_num diseases
N1 F1 A1 <=10 1 2
N1 F1 A1 11-20 2 3
N1 F1 A1 21-40 3 5
N1 F1 A1 41-80 4 2
N2 F2 A1 11-20 2 6
N2 F2 A1 21-40 3 1
N2 F2 A1 41-80 4 8
N3 F2 A2 <=10 1 8
N3 F2 A2 11-20 2 4
N3 F2 A2 21-40 4 6
N4 F3 A2 11-20 2 5
N4 F3 A2 41-80 4 7
命名家庭地区年龄层年龄层疾病
N1 F1 A1不确定我是否正确理解了这个问题:是否Df.sort(['Name'、'Family'、'Area'、'diseases'))
help?
Name Family Area age_tier age_tier_num diseases
N1 F1 A1 <=10 1 2
N1 F1 A1 11-20 2 2
N1 F1 A1 21-40 3 3
N1 F1 A1 41-80 4 5
N2 F2 A1 11-20 2 1
N2 F2 A1 21-40 3 6
N2 F2 A1 41-80 4 8
N3 F2 A2 <=10 1 4
N3 F2 A2 11-20 2 6
N3 F2 A2 21-40 4 8
N4 F3 A2 11-20 2 5
N4 F3 A2 41-80 4 7