Python 基于值筛选数据帧中的行
我有如下类似的数据帧(这只是一个示例): 城市沿着Python 基于值筛选数据帧中的行,python,pandas,dataframe,group-by,pandas-groupby,Python,Pandas,Dataframe,Group By,Pandas Groupby,我有如下类似的数据帧(这只是一个示例): 城市沿着Cities\u标签字段重复。我想根据城市的最高时间值筛选城市。我想要的输出示例如下: i TIME CITIES_LABEL Value lat_rounded long 6 2005 Eindhoven 9 165 51.441642 5.469722 9 2005 Enschede 6 250 52.221537 6.893662 10 2005 A
Cities\u标签
字段重复。我想根据城市的最高时间值筛选城市。我想要的输出示例如下:
i TIME CITIES_LABEL Value lat_rounded long
6 2005 Eindhoven 9 165 51.441642 5.469722
9 2005 Enschede 6 250 52.221537 6.893662
10 2005 Arnhem 6 025 51.985103 5.898730
13 2005 Breda 8 565 51.571915 4.768323
14 2010 Groningen 6 325 51.812563 5.837226
15 2005 Apeldoorn 7 005 52.211157 5.969923
16 2007 Utrecht 3 785 53.201233 5.799913
17 2006 Rotterdam 7 130 52.387388 4.646219
18 2005 Zaanstad 6 060 52.457966 4.751042
19 2008 Tilburg 6 945 51.697816 5.303675
20 2007 Amsterdam 5 840 52.156111 5.387827
21 2005 Maastricht 5 220 50.851368 5.690972
关于如何最好地在熊猫身上处理这个问题,你有什么想法吗
编辑
我的问题与之不同,因为我正在为TIME
和CITIES\u LABEL
寻找一个过滤器,而上一个问题只考虑基于一个字段的(最大)值进行过滤,而不考虑其他字段中的重复项使用groupby
和idxmax
df.ix[df.groupby('CITIES_LABEL').TIME.idxmax()]
使用groupby
和idxmax
df.ix[df.groupby('CITIES_LABEL').TIME.idxmax()]
可能重复的@ASGM我的问题与您建议的两个不同,因为我正在为TIME
和CITIES\u LABEL
寻找一个过滤器,而前面的问题只针对一个字段的(最大)值进行过滤,而且它不关心其他领域的重复。@ASGM我没有添加我尝试过的内容,因为我没有使用任何方法来解决它,我正在寻找更好(更简单)的方法使用@ASGM的pandasPossible duplicate的方法我的问题与您建议的两个不同,因为我正在为TIME
和CITIES\u LABEL
寻找一个过滤器,而前面的问题只针对一个字段的(最大)值进行过滤,它不关心其他领域的重复。@ASGM我没有添加我尝试过的内容,因为我没有使用任何pandas方法来解决它,我正在寻找一种更好(更简单)的方法使用Pandastank you,我确信存在一个更简单的解决方案!谢谢,我确信存在一个更简单的解决方案!