Numpy 熊猫聚集在一起,与南一起计数
熊猫们数着南的。我需要一个包含它们的计数。Numpy对一些但不是所有nan修改的聚合都有聚合,我是否必须使用自定义聚合,或者是否有我找不到的方法来实现这一点 这是给groupby的,我想要普通的NaN功能来表示平均值,但奇怪的是计数。编码Numpy 熊猫聚集在一起,与南一起计数,numpy,pandas,Numpy,Pandas,熊猫们数着南的。我需要一个包含它们的计数。Numpy对一些但不是所有nan修改的聚合都有聚合,我是否必须使用自定义聚合,或者是否有我找不到的方法来实现这一点 这是给groupby的,我想要普通的NaN功能来表示平均值,但奇怪的是计数。编码 In [1]: import numpy In [2]: import pandas as pd In [3]: df = pd.DataFrame([[0,float('nan')],[0,float('nan')],[0,float('nan')]])
In [1]: import numpy
In [2]: import pandas as pd
In [3]: df = pd.DataFrame([[0,float('nan')],[0,float('nan')],[0,float('nan')]])
In [4]: df.groupby(0).agg(['count', 'mean'])
Out[4]:
1
count mean
0
0 0 NaN
我希望输出为3 Nan而不是0 Nan。如果您唯一的问题是计数,您可以这样替换Nan值:
In [17] : df = pd.DataFrame([0,NaN,3])
print df.count()
Out [17]: 0 2
dtype: int64
In [18] : marker = -1
df = df.fillna(marker)
print df.count()
Out [18]: 0 3
dtype: int64
只需使用len()
输出:
1
count mean size
0
0 0 NaN 3
你能展示你想要解决的问题和想要的输出吗?添加了一些代码,我不知道如何格式化它,抱歉。我正在尝试使用多个聚合,其中一些需要nan,其他不需要。这是为求和/积处理的,但不是计数。大小是我想要的。@Snark您可以使用NULL或_NULL这样的标记。我使用下划线对groupby函数进行排序,不需要定义大小。
1
count mean size
0
0 0 NaN 3