Pandas 基于条件的列合并

Pandas 基于条件的列合并,pandas,Pandas,这是我的朋友: Id Protein A_Egg B_Meat C_Milk Category A 10 10 20 0 egg B 20 10 0 10 milk C 20 10 10 10 meat D 25 20 10 0 egg 我希望根据“类别”将蛋白质列与其他列合并 我的输出是 Id Pro

这是我的朋友:

Id  Protein A_Egg   B_Meat  C_Milk  Category
A   10        10      20       0    egg
B   20        10       0      10    milk
C   20        10      10      10    meat
D   25        20      10       0    egg
我希望根据“类别”将蛋白质列与其他列合并

我的输出是

Id  Protein_final
A      20         
B      30         
C      30
D      45
理想情况下,我想展示我是如何接近的,但坦率地说,我毫无头绪

编辑:另外,如何处理类别为空或是否满足某一列(在该列中,can final应与protein列中的初始值相同)

与一些预处理一起使用,在
之前的列名称中删除值,最后添加到列:

arr = df.rename(columns=lambda x: x.split('_')[-1].lower()).lookup(df.index, df['Category'])

df['Protein'] += arr
print (df)
  Id  Protein  A_Egg  B_Meat  C_Milk Category
0  A       20     10      20       0      egg
1  B       30     10       0      10     milk
2  C       30     10      10      10     meat
3  D       45     20      10       0      egg
如果最后只需要两列:

df = df[['Id','Protein']]
您可以选择dataframe,筛选类别等于变量列的行,并对最后的列求和:

(
    df
     .melt(["Id", "Protein", "Category"])
     .assign(variable=lambda x: x.variable.str[2:].str.lower(),
             Protein_final=lambda x: x.Protein + x.value)
     .query("Category == variable")
     .filter(["Id", "Protein_final"])
)

    Id  Protein_final
  0 A   20
  3 D   45
  6 C   30
  9 B   30

谢谢正如编辑:同样,如何处理类别为空或是否满足某一列(在该列中,can最终值应与蛋白质列中的初始值相同)。。。。在这种情况下,使用be of进行索引将导致错误。。。。