Python 2.7 熊猫统计一列数据中不同项目的数量
我有一个包含以下内容的数据框(仅一个示例): 我希望能够找出给定子类型有多少不同的集群。在这种情况下,所需输出为:Python 2.7 熊猫统计一列数据中不同项目的数量,python-2.7,pandas,Python 2.7,Pandas,我有一个包含以下内容的数据框(仅一个示例): 我希望能够找出给定子类型有多少不同的集群。在这种情况下,所需输出为: Subtype # of Clusters H10N4 2 H3N8 2 我一直在做Pandas,我在数据帧上应用了一个.groupby('Subtype'),但是在我这样做之后,我不知道如何继续。任何帮助都将不胜感激 您可以使用: 然后计算每个组中的唯一群集: In [12]: g.apply(lambda s: len(s['Cluster'].u
Subtype # of Clusters
H10N4 2
H3N8 2
我一直在做Pandas,我在数据帧上应用了一个.groupby('Subtype')
,但是在我这样做之后,我不知道如何继续。任何帮助都将不胜感激 您可以使用:
然后计算每个组中的唯一群集:
In [12]: g.apply(lambda s: len(s['Cluster'].unique()))
Out[12]:
Subtype
H10N4 2
H3N8 2
dtype: int64
正是我需要的。谢谢你,安迪!您也可以只使用
groupby(['Subtype','Cluster'])。size()
@AndyHayden true,抱歉。但groupby是这样做的,不是吗?虽然,这并不十分得到正确答案,但这并不十分得到正确答案,虽然::::以下以下以下不太得到正确答案:虽然,这并不十分得到答案,但这并不十分得到了正确答案:虽然::::uuuu厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄UUUUUUUUUUUUUUUUUUUUUUUUUUUUUUUU卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢卢UUUUUUUUUUUU厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄厄亚型簇H10N4 23 1 59 3 H3N8 22 2 44 2_________________________________________________________________________________________________(对不起,注释中还有代码块吗?@joeh没有(按设计)!是的,大小为您提供了一个MI,它隐式地包含您需要的信息,但不确定从该信息到所需信息的干净方式:s
In [11]: g = df.groupby('Subtype')
In [12]: g.apply(lambda s: len(s['Cluster'].unique()))
Out[12]:
Subtype
H10N4 2
H3N8 2
dtype: int64