Python 使用pandas在数据帧中仅保留一条具有给定ID的记录

Python 使用pandas在数据帧中仅保留一条具有给定ID的记录,python,pandas,Python,Pandas,我正在使用pandas将两个CSV文件合并到一个文件中,该文件由一个名为ProjectID的列索引。完成后,仍有大量重复记录。我只想保留其中的最新版本(它们的日期顺序从最短到最新)。到目前为止,我掌握的代码是: merged_df = pandas.merge(df1, df2, on="ProjectID", how="left") 我遇到的问题是如何只保留最后一行,其中有多个项目版本。熊猫是否有任何内置功能可以帮助实现这一点 编辑以添加示例数据 当前数据 ProjectID Valu

我正在使用
pandas
将两个CSV文件合并到一个文件中,该文件由一个名为ProjectID的列索引。完成后,仍有大量重复记录。我只想保留其中的最新版本(它们的日期顺序从最短到最新)。到目前为止,我掌握的代码是:

merged_df = pandas.merge(df1, df2, on="ProjectID", how="left")
我遇到的问题是如何只保留最后一行,其中有多个项目版本。熊猫是否有任何内置功能可以帮助实现这一点

编辑以添加示例数据

当前数据

ProjectID    Value    Date
1            54       9/21/2010
2            32       10/22/2010
2            32       10/28/2010
3            76       9/21/2010
4            37       9/21/2010
4            37       11/12/2010
4            38       11/14/2010
通缉数据

ProjectID    Value    Date
1            54       9/21/2010
2            32       10/28/2010
3            76       9/21/2010
4            38       11/14/2010

drop_duplicates
是熊猫从数据帧中删除重复项的go to功能。默认情况下,它保留第一个观察到的重复值,但您可以使用
take\u last=
参数保留最后一个值


尝试:
merged\u df2=merged\u df.drop\u duplicates('projectd',take\u last=True)
drop\u duplicates
是熊猫从数据帧中删除重复项的功能。默认情况下,它保留第一个观察到的重复值,但您可以使用
take\u last=
参数保留最后一个值


尝试:
merged\u df2=merged\u df.删除重复项('projectd',take\u last=True)

好问题!你能给我们提供一些简短的示例数据吗?这将大大有助于提供答案。非常好的问题!你能给我们提供一些简短的示例数据吗?这将大大有助于提供答案。