Pandas 基于条件的列合并
这是我的朋友:Pandas 基于条件的列合并,pandas,Pandas,这是我的朋友: Id Protein A_Egg B_Meat C_Milk Category A 10 10 20 0 egg B 20 10 0 10 milk C 20 10 10 10 meat D 25 20 10 0 egg 我希望根据“类别”将蛋白质列与其他列合并 我的输出是 Id Pro
Id Protein A_Egg B_Meat C_Milk Category
A 10 10 20 0 egg
B 20 10 0 10 milk
C 20 10 10 10 meat
D 25 20 10 0 egg
我希望根据“类别”将蛋白质列与其他列合并
我的输出是
Id Protein_final
A 20
B 30
C 30
D 45
理想情况下,我想展示我是如何接近的,但坦率地说,我毫无头绪
编辑:另外,如何处理类别为空或是否满足某一列(在该列中,can final应与protein列中的初始值相同)与一些预处理一起使用,在之前的列名称中删除值,最后添加到列:
arr = df.rename(columns=lambda x: x.split('_')[-1].lower()).lookup(df.index, df['Category'])
df['Protein'] += arr
print (df)
Id Protein A_Egg B_Meat C_Milk Category
0 A 20 10 20 0 egg
1 B 30 10 0 10 milk
2 C 30 10 10 10 meat
3 D 45 20 10 0 egg
如果最后只需要两列:
df = df[['Id','Protein']]
您可以选择dataframe,筛选类别等于变量列的行,并对最后的列求和:
(
df
.melt(["Id", "Protein", "Category"])
.assign(variable=lambda x: x.variable.str[2:].str.lower(),
Protein_final=lambda x: x.Protein + x.value)
.query("Category == variable")
.filter(["Id", "Protein_final"])
)
Id Protein_final
0 A 20
3 D 45
6 C 30
9 B 30
谢谢正如编辑:同样,如何处理类别为空或是否满足某一列(在该列中,can最终值应与蛋白质列中的初始值相同)。。。。在这种情况下,使用be of进行索引将导致错误。。。。