Python 删除每行中每列中的重复值
我有4列(姓名、地区、州、电子邮件)。在我分组并加入值后,列中的电子邮件有重复的电子邮件。输出结果是:Python 删除每行中每列中的重复值,python,pandas,Python,Pandas,我有4列(姓名、地区、州、电子邮件)。在我分组并加入值后,列中的电子邮件有重复的电子邮件。输出结果是: Area Group Shift Email KM MFG A1,A2,A3 a@gmail.com,a@gmail.com,b@gmail.com RIM TEST A1,B1 c@gmail.com,b@gmail.com,c@gmail.com PNG FINISH C1,C2,C3
Area Group Shift Email
KM MFG A1,A2,A3 a@gmail.com,a@gmail.com,b@gmail.com
RIM TEST A1,B1 c@gmail.com,b@gmail.com,c@gmail.com
PNG FINISH C1,C2,C3 a@gmail.com,c@gmail.com,a@gmail.com
KL Manager NORMAL,B1,B1 b@gmail.com,a@gmail.com,c@gmail.com,a@gmail.com
我需要删除“电子邮件”列中的重复电子邮件。有人能帮我吗?IIUC,你需要这个:
df['Email'] = df['Email'].str.split(',').apply(lambda x: ','.join(set(x)))
输出:
Area Group Shift Email
0 KM MFG A1,A2,A3 a@gmail.com,b@gmail.com
1 RIM TEST A1,B1 c@gmail.com,b@gmail.com
2 PNG FINISH C1,C2,C3 a@gmail.com,c@gmail.com
3 KL Manager NORMAL,B1,B1 a@gmail.com,c@gmail.com,b@gmail.com
让我们试试
df.Email=df.Email.str.split(',').apply(set).str.join(',')
df
Area Group Shift Email
0 KM MFG A1,A2,A3 a@gmail.com,b@gmail.com
1 RIM TEST A1,B1 c@gmail.com,b@gmail.com
2 PNG FINISH C1,C2,C3 c@gmail.com,a@gmail.com
3 KL Manager NORMAL,B1,B1 c@gmail.com,a@gmail.com,b@gmail.com
请向我们显示您的分组代码,以便我们可以告诉您如何更改以删除重复项。df=df.groupby(['Area','Group])['Email']。apply(','.join)。reset_index()您也可以。。我生锈了。。。你有更好的答案。:)