Python 计算组中重复和唯一的值
假设我有一个数据帧:Python 计算组中重复和唯一的值,python,pandas,group-by,Python,Pandas,Group By,假设我有一个数据帧: DF1: Class | Age | City | Color A | 20 | Los Angeles | Blue A | 20 | Los Angeles | Blue A | 20 | Los Angeles | Red B | 25 | Phoenix | Yellow 我希望获得每个重复和唯一值的唯一计数,因此输出如下所示: DF2: Class | Age | City | Colo
DF1:
Class | Age | City | Color
A | 20 | Los Angeles | Blue
A | 20 | Los Angeles | Blue
A | 20 | Los Angeles | Red
B | 25 | Phoenix | Yellow
我希望获得每个重复和唯一值的唯一计数,因此输出如下所示:
DF2:
Class | Age | City | Color | Count
A | 20 | Los Angeles | Blue | 2
A | 20 | Los Angeles | Red | 1
B | 25 | Phoenix | Yellow | 1
在这种情况下,Class
A、Age
20、City
Los Angeles和Color
蓝色显示两次。我曾尝试使用nunique
,但我的输出并没有将重复的值折叠在一起
df = df.groupby(['Class', 'Age', 'City', 'Color']).nunique()
您可以使用:
输出
Class Age City Color Count
0 A 20 Los Angeles Blue 2
1 A 20 Los Angeles Red 1
2 B 25 Phoenix Yellow 1
df.groupby(['Class','Age','City','Color']).nunique()返回了什么?
Class Age City Color Count
0 A 20 Los Angeles Blue 2
1 A 20 Los Angeles Red 1
2 B 25 Phoenix Yellow 1