Python 基于特定值的最近日期的输出行
我有一个5列的数据框。我需要在代码、类id和最近日期上具有相同值的行Python 基于特定值的最近日期的输出行,python,pandas,Python,Pandas,我有一个5列的数据框。我需要在代码、类id和最近日期上具有相同值的行 code class_id grade date class_name 7 48 b 01/12/17 algebra 8 85 a 07/28/08 calculus 10
code class_id grade date class_name
7 48 b 01/12/17 algebra
8 85 a 07/28/08 calculus
10 50 b 12/12/10 geometry
7 48 c 07/10/19 history
23 48 b 12/8/14 literature
8 85 d 01/01/2020 economics
输出
7 48 c 07/10/19 history
8 85 d 01/01/2020 economics
将
string
date转换为datetime
对象,然后执行groupby
和merge
示例代码是
df['date1']=pd.to_datetime(df['date'],格式='%d/%M/%y',errors='concurve',exact=False)
df2=df.groupby(['code','class_id']).agg({
“日期1”:“最大值”,
“等级”:“计数”
}).reset_index()
df2=df2[df2['grade']>1]。删除(列=['grade'])
合并(df,how='left',on=['code','class_id','date1']))
以上代码的输出如下
code class_id date1 grade date class_name
0 7 48 2019-01-07 00:10:00 c 07/10/19 history
1 8 85 2020-01-01 00:01:00 d 01/01/2020 economics
我有一个包含数千行的数据框。谢谢。到底是什么问题?你试过什么,做过什么研究吗?Stack Overflow不是免费的代码编写服务,也不是为了提供个性化的指南和教程。见:。