Python 熊猫:如何选择组中唯一的行
我有一个分组数据框,在所有组中都有一个名为“PART_ID”的列,每个组中该列中的值可能重复。我希望根据此列的值在每个组中唯一化,并仅保留唯一的值 我以为这只是分组对象上的.unique()的一个例子,但这不起作用。也没有设置选项。如何获取组中的唯一行?。例如,第1列上的分组 A 10 A 10 A 12 B 10 B 15 应该给 A 10 A 12 B 10 B 15使用.unique() 或者没有独特的你可以做一些像Python 熊猫:如何选择组中唯一的行,python,pandas,pandas-groupby,Python,Pandas,Pandas Groupby,我有一个分组数据框,在所有组中都有一个名为“PART_ID”的列,每个组中该列中的值可能重复。我希望根据此列的值在每个组中唯一化,并仅保留唯一的值 我以为这只是分组对象上的.unique()的一个例子,但这不起作用。也没有设置选项。如何获取组中的唯一行?。例如,第1列上的分组 A 10 A 10 A 12 B 10 B 15 应该给 A 10 A 12 B 10 B 15使用.unique() 或者没有独特的你可以做一些像 grouped_df['column_1'].apply(list).a
grouped_df['column_1'].apply(list).apply(set)
看到了吗?和?
drop_duplicates
:)这里的问题是groupby。我已经做了一些操作,这些操作需要在组上进行,现在需要进行。drop_duplicates和unique不适用于groupby对象显示按第一列分组并取第二列的平均值?类似的输出应该是(10+10+12)/3等等
grouped_df['column_1'].apply(list).apply(set)