Python 删除每行中每列中的重复值

Python 删除每行中每列中的重复值,python,pandas,Python,Pandas,我有4列(姓名、地区、州、电子邮件)。在我分组并加入值后,列中的电子邮件有重复的电子邮件。输出结果是: Area Group Shift Email KM MFG A1,A2,A3 a@gmail.com,a@gmail.com,b@gmail.com RIM TEST A1,B1 c@gmail.com,b@gmail.com,c@gmail.com PNG FINISH C1,C2,C3

我有4列(姓名、地区、州、电子邮件)。在我分组并加入值后,列中的电子邮件有重复的电子邮件。输出结果是:

Area    Group   Shift         Email
KM      MFG     A1,A2,A3      a@gmail.com,a@gmail.com,b@gmail.com
RIM     TEST    A1,B1         c@gmail.com,b@gmail.com,c@gmail.com
PNG    FINISH   C1,C2,C3      a@gmail.com,c@gmail.com,a@gmail.com
KL     Manager  NORMAL,B1,B1  b@gmail.com,a@gmail.com,c@gmail.com,a@gmail.com
我需要删除“电子邮件”列中的重复电子邮件。有人能帮我吗?IIUC,你需要这个:

df['Email'] = df['Email'].str.split(',').apply(lambda x: ','.join(set(x)))
输出:

  Area    Group         Shift                                Email
0   KM      MFG      A1,A2,A3              a@gmail.com,b@gmail.com
1  RIM     TEST         A1,B1              c@gmail.com,b@gmail.com
2  PNG   FINISH      C1,C2,C3              a@gmail.com,c@gmail.com
3   KL  Manager  NORMAL,B1,B1  a@gmail.com,c@gmail.com,b@gmail.com
让我们试试

df.Email=df.Email.str.split(',').apply(set).str.join(',')
df
  Area    Group         Shift                                Email
0   KM      MFG      A1,A2,A3              a@gmail.com,b@gmail.com
1  RIM     TEST         A1,B1              c@gmail.com,b@gmail.com
2  PNG   FINISH      C1,C2,C3              c@gmail.com,a@gmail.com
3   KL  Manager  NORMAL,B1,B1  c@gmail.com,a@gmail.com,b@gmail.com

请向我们显示您的分组代码,以便我们可以告诉您如何更改以删除重复项。df=df.groupby(['Area','Group])['Email']。apply(','.join)。reset_index()您也可以。。我生锈了。。。你有更好的答案。:)