Python 使用pandas在数据帧中仅保留一条具有给定ID的记录_Python_Pandas

Python 使用pandas在数据帧中仅保留一条具有给定ID的记录

python pandas

Python 使用pandas在数据帧中仅保留一条具有给定ID的记录,python,pandas,Python,Pandas,我正在使用pandas将两个CSV文件合并到一个文件中，该文件由一个名为ProjectID的列索引。完成后，仍有大量重复记录。我只想保留其中的最新版本（它们的日期顺序从最短到最新）。到目前为止，我掌握的代码是： merged_df = pandas.merge(df1, df2, on="ProjectID", how="left") 我遇到的问题是如何只保留最后一行，其中有多个项目版本。熊猫是否有任何内置功能可以帮助实现这一点编辑以添加示例数据当前数据 ProjectID Valu

我正在使用

pandas

将两个CSV文件合并到一个文件中，该文件由一个名为ProjectID的列索引。完成后，仍有大量重复记录。我只想保留其中的最新版本（它们的日期顺序从最短到最新）。到目前为止，我掌握的代码是：

merged_df = pandas.merge(df1, df2, on="ProjectID", how="left")

我遇到的问题是如何只保留最后一行，其中有多个项目版本。熊猫是否有任何内置功能可以帮助实现这一点

编辑以添加示例数据

当前数据

ProjectID    Value    Date
1            54       9/21/2010
2            32       10/22/2010
2            32       10/28/2010
3            76       9/21/2010
4            37       9/21/2010
4            37       11/12/2010
4            38       11/14/2010

通缉数据

ProjectID    Value    Date
1            54       9/21/2010
2            32       10/28/2010
3            76       9/21/2010
4            38       11/14/2010

drop_duplicates

是熊猫从数据帧中删除重复项的go to功能。默认情况下，它保留第一个观察到的重复值，但您可以使用

take\u last=

参数保留最后一个值

尝试：

merged\u df2=merged\u df.drop\u duplicates（'projectd'，take\u last=True）

drop\u duplicates

是熊猫从数据帧中删除重复项的功能。默认情况下，它保留第一个观察到的重复值，但您可以使用

take\u last=

参数保留最后一个值

尝试：

merged\u df2=merged\u df.删除重复项（'projectd'，take\u last=True）

好问题！你能给我们提供一些简短的示例数据吗？这将大大有助于提供答案。非常好的问题！你能给我们提供一些简短的示例数据吗？这将大大有助于提供答案。