Python 如何按A列和B列中的差异对数据帧进行排序

Python 如何按A列和B列中的差异对数据帧进行排序,python,pandas,dataframe,sorting,Python,Pandas,Dataframe,Sorting,上面是我的数据框,我想根据ConferencealPost和TopPost之间的差异进行排序。我该怎么做 我试图做一个情绪分析,看看哪些词最常见,哪些词不常见。谢谢 您只需在数据框中添加一个名为“差异”的额外列,并按该列排序即可。类似这样的东西df['Score_diff']=df['contriversialpost']-df['topost'] Word ControversialPost TopPost 0 to 5756 4169 1 I 5717 4

上面是我的数据框,我想根据ConferencealPost和TopPost之间的差异进行排序。我该怎么做


我试图做一个情绪分析,看看哪些词最常见,哪些词不常见。谢谢

您只需在数据框中添加一个名为“差异”的额外列,并按该列排序即可。类似这样的东西
df['Score_diff']=df['contriversialpost']-df['topost']

Word    ControversialPost   TopPost
0   to  5756    4169
1   I   5717    4360
2   the 5416    4298
3   a   4929    3467
4   and 4071    2679
5   in  2814    1988
6   of  2771    1835
7   my  2325    1883
8   for 1989    1487
9   is  1961    1364
10  have    1713    1291
11  that    1552    1042
12  it  1452    1059
13  on  1404    1021
14  be  1302    1104
印刷品:

Word有争议的帖子
14 be 1302 1104
14041021年11月13日
12 it 1452 1059
10有1713 1291
7我的23251883
1989年8月1487日
11即1552 1042
9是1961年1364年
1988年8月5日
27711835年第6号
2 54164298
1 I 57174360
4及40712679
3 a 49293467
0至57564169

为差异添加一个列,然后对值进行排序即可

print(
    df.assign(tmp=df["ControversialPost"] - df["TopPost"])
    .sort_values(by="tmp")
    .drop(columns="tmp")
)
df = pd.DataFrame([[1000, 950], [400, 300], [100,  80]], columns=['ControversialPost', 'TopPost'])
df['difference'] = df['ControversialPost'] - df['TopPost']
df = df.sort_values('difference', ascending=False)
print(df)


   ControversialPost  TopPost  difference
1                400      300         100
0               1000      950          50
2                100       80          20