Python 熊猫:如何总结数据、分组、独特
以下是我正在使用的数据帧:Python 熊猫:如何总结数据、分组、独特,python,pandas,Python,Pandas,以下是我正在使用的数据帧: company | pc-serial | software --------+-----------+-------------------- A | 1 | Word A | 1 | Excel A | 2 | Word A | 3 | PowerPoint B | 4 | Word B | 4 |
company | pc-serial | software
--------+-----------+--------------------
A | 1 | Word
A | 1 | Excel
A | 2 | Word
A | 3 | PowerPoint
B | 4 | Word
B | 4 | Excel
B | 4 | Visio
B | 5 | Word
B | 5 | PowerPoint
我想建立一个新的数据框架,告诉我每个公司拥有的独特软件的数量,结果应该是:
company | unique_sw
--------+--------------
A | 3
B | 4
A有3个(Word、Excel和PowerPoint),B有4个(Word、Excel、PowerPoint和Visio)
我尝试了df.groupby('company')['software'].count()
它给出了所有软件A有4个,B有5个的计数。如果我更改unique()
的count()
,它将首次出现“软件”
因此,我不知道如何汇总这些信息。请使用以下信息:
df.groupby('company')['software'].nunique()
改用这个:
df.groupby('company')['software'].nunique()
或者您可以通过删除重复项来修复代码
df.drop_duplicates(['company','software']).groupby('company').software.count()
Out[690]:
company
A 3
B 4
Name: software, dtype: int64
或者您可以通过删除重复项来修复代码
df.drop_duplicates(['company','software']).groupby('company').software.count()
Out[690]:
company
A 3
B 4
Name: software, dtype: int64
美丽的!谢谢!美丽的!谢谢!