Python 使用pandas对联合列值进行分组
我有以下数据集Python 使用pandas对联合列值进行分组,python,pandas,Python,Pandas,我有以下数据集 colA ColB ColC a 1 aa a 1 Nan a 2 a 2 bb a 2 cc 我希望输出如下 colA ColB ColC a 1 aa a 2 bb#cc 我试着根据可乐和可乐以及联合可乐的价值观进行分组。我试着在Pandas中使用以下代码。但是我没有得到 test1 = test(['colA','colB'])['colC'].apply(lambda x
colA ColB ColC
a 1 aa
a 1 Nan
a 2
a 2 bb
a 2 cc
我希望输出如下
colA ColB ColC
a 1 aa
a 2 bb#cc
我试着根据可乐和可乐以及联合可乐的价值观进行分组。我试着在Pandas中使用以下代码。但是我没有得到
test1 = test(['colA','colB'])['colC'].apply(lambda x: x.sum() )
它必须避免列中的Nan或空格,并用#分隔符连接所有值。1st
将所有Nan和空格替换为np.Nan
,然后dropna
,问题就变得简单了groupby
agg
join
df=df.replace({'Nan':np.nan,' ':np.nan})
df.dropna().groupby(['colA','ColB'],as_index=False).ColC.agg(','.join)
colA ColB ColC
0 a 1 aa
1 a 2 bb,cc