String 通过按类型分组创建新列,新列';s值为整个组';s列值
我有一个熊猫数据框,基本上看起来像这样:String 通过按类型分组创建新列,新列';s值为整个组';s列值,string,python-2.7,pandas,group-by,aggregate,String,Python 2.7,Pandas,Group By,Aggregate,我有一个熊猫数据框,基本上看起来像这样: type item string 1 0 aa 1 1 bb 1 2 cc 2 0 dd 2 1 ee 2 2 ff 我想基于组的“字符串”列创建一个新列“newstring” type item string newstring 1 0 aa aa
type item string
1 0 aa
1 1 bb
1 2 cc
2 0 dd
2 1 ee
2 2 ff
我想基于组的“字符串”列创建一个新列“newstring”
type item string newstring
1 0 aa aa+bb+cc
1 1 bb aa+bb+cc
1 2 cc aa+bb+cc
2 0 dd dd+ee+ff
2 1 ee dd+ee+ff
2 2 ff dd+ee+ff
我做完了
df.groupby('type').aggregate(lambda x: "+".join(x))
df.groupby('type').apply(lambda x: "+".join(x))
但我在newstring(字面意思)中不断得到结果
如何按特定列分组,然后将该组中一列的值附加到新列
提前谢谢 很抱歉,您是在这样做吗:
In [14]:
df['new_string'] = df.groupby('type')['string'].transform(lambda x: '+'.join(x))
df
Out[14]:
type item string new_string
0 1 0 aa aa+bb+cc
1 1 1 bb aa+bb+cc
2 1 2 cc aa+bb+cc
3 2 0 dd dd+ee+ff
4 2 1 ee dd+ee+ff
5 2 2 ff dd+ee+ff
上面的组在“type”上,然后我们在“string”列上调用transform
,并调用一个lambda函数,该函数连接字符串值
您尝试失败的原因是您的函数应用于其余列,而不是专门应用于字符串列。此外,这里的
转换
返回一个序列,该序列的索引与原始df对齐。就像一个符咒。我现在看得很清楚。非常感谢你!
In [14]:
df['new_string'] = df.groupby('type')['string'].transform(lambda x: '+'.join(x))
df
Out[14]:
type item string new_string
0 1 0 aa aa+bb+cc
1 1 1 bb aa+bb+cc
2 1 2 cc aa+bb+cc
3 2 0 dd dd+ee+ff
4 2 1 ee dd+ee+ff
5 2 2 ff dd+ee+ff