Python 如何在最大值条件下保持重复观测?
这是我的数据集的标题Python 如何在最大值条件下保持重复观测?,python,pandas,Python,Pandas,这是我的数据集的标题 SM_id SM_nom ... MRS_CO_VER Territoire 0 101 Montréal : Centre-ville ... V2017-08 3598479 1 102 Montréal : Centre-ville périphérique ... V2017-08 14048443 2 103
SM_id SM_nom ... MRS_CO_VER Territoire
0 101 Montréal : Centre-ville ... V2017-08 3598479
1 102 Montréal : Centre-ville périphérique ... V2017-08 14048443
2 103 Montréal : Sud-Ouest ... V2017-08 15130563
3 103 Montréal : Sud-Ouest ... V2017-08 197
4 104 Montréal : Notre-Dame-de-Grâce ... V2017-08 10828311
SM_id
变量中存在一些重复项。我只想保留在每个唯一的SM\u id
内Territoire
变量上具有最大值的观察值
我试过这个:
MRC_to_SM=MRC_to_SM[MRC_to_SM.Territoire==MRC_to_SM.Territoire.max(level='SM_id')]
我得到了这个错误:
级别名称SM\u id不是索引的名称
我应该如何进行
谢谢,您使用了错误的函数
idxmax
就是您要查找的:
idx = df.groupby('SM_id')['Territoire'].idxmax()
df = df[df.index.isin(idx)]
欢迎来到这里,这个问题与上面的问题完全相同。一定要尝试下面列出的方法,因为它是有效的。谢谢