Python 将函数聚合到dataframe,同时在数据框中保留行

Python 将函数聚合到dataframe,同时在数据框中保留行,python,pandas,dataframe,group-by,gis,Python,Pandas,Dataframe,Group By,Gis,我想根据名为COLLISION\u ID的字段和每个COLLISION\u ID的计数来聚合数据 我想删除重复的碰撞ID,因为它们具有相同的坐标,但保留原始数据集中出现的次数 我的代码在下面 df2 = df1.groupby(['COLLISION_ID'])[['COLLISION_ID']].count() 这将返回以下内容: 我希望将我的数据返回为冲突\u ID数字、计数和我的数据中未显示的剩余列(约40个附加列,稍后将进行筛选)如果您谈论的是筛选,我们应该执行转换 df1['cou

我想根据名为
COLLISION\u ID
的字段和每个
COLLISION\u ID
的计数来聚合数据

我想删除重复的碰撞ID,因为它们具有相同的坐标,但保留原始数据集中出现的次数

我的代码在下面

df2 = df1.groupby(['COLLISION_ID'])[['COLLISION_ID']].count()
这将返回以下内容:


我希望将我的数据返回为
冲突\u ID
数字、计数和我的数据中未显示的剩余列(约40个附加列,稍后将进行筛选)

如果您谈论的是筛选,我们应该执行
转换

df1['count_col']=df1.groupby(['COLLISION_ID'])['COLLISION_ID'].transform('count')

然后可以使用列计数过滤df1

我执行了此步骤,但行数仍然与以前相同。我希望每个唯一的冲突ID仅被视为一条记录(例如:我有一个冲突ID的4条记录)。计数字段为4,但仍有4列。我正在寻找唯一的碰撞ID,我可以使用.unique()函数,但我希望将其转换为dataframe@StevenNac尝试df=df.drop_duplicates('COLLISION_ID')?这就是所需要的,这么简单的一步,我不知道函数是用Python编写的,我是个初学者。非常感谢你