Python:将DataFrameGroupBy对象重新索引到Dataframe错误
我有一个简单的初始数据帧:Python:将DataFrameGroupBy对象重新索引到Dataframe错误,python,pandas,pandas-groupby,Python,Pandas,Pandas Groupby,我有一个简单的初始数据帧: ID, ATTRIBUTE 1, thing2 1, thing3 1, thing3 2, thing7 2, thing7 2, thing2 3, thing1 3, thing2 我有一个简单的groupby对象,我想在其中创建属性模式(如果它是多模态的,我将结果称为“multithing”): 我试图在重新编制索引后得到如下结果: ID, ATTRIBUTE 1, thing3 2, thing7 3, multithing df_final.group
ID, ATTRIBUTE
1, thing2
1, thing3
1, thing3
2, thing7
2, thing7
2, thing2
3, thing1
3, thing2
我有一个简单的groupby对象,我想在其中创建属性模式(如果它是多模态的,我将结果称为“multithing”):
我试图在重新编制索引后得到如下结果:
ID, ATTRIBUTE
1, thing3
2, thing7
3, multithing
df_final.groupby('ATTRIBUTE')['ID'].count()
因此,我可以再次将其用作常规数据帧,并执行以下操作:
ID, ATTRIBUTE
1, thing3
2, thing7
3, multithing
df_final.groupby('ATTRIBUTE')['ID'].count()
IIUC:
或
第二个是完美的。我知道我以前在lambda函数上做错了什么。最后一个问题,如果你不介意的话?在这种情况下,模式lambda是否忽略属性的np.nan值?我希望它只找到非空值的模式。
In [205]: df.groupby('ID', as_index=False)['ATTRIBUTE'] \
...: .agg(lambda x: x.mode()[0] if len(x.mode()) == 1 else 'multithing')
Out[205]:
ID ATTRIBUTE
0 1 thing3
1 2 thing7
2 3 multithing