Python 如何在熊猫中使用.isin和groupby
我试图检查是否在p_id中找到dup_id,然后将dup_id和“p_id”行分组在一起。通过为每个组指定唯一的“否”来对它们进行分组Python 如何在熊猫中使用.isin和groupby,python,duplicates,pandas-groupby,Python,Duplicates,Pandas Groupby,我试图检查是否在p_id中找到dup_id,然后将dup_id和“p_id”行分组在一起。通过为每个组指定唯一的“否”来对它们进行分组 对于df[p_id']中的ind,val。iteritems(): 如果df['dup_id']中的val: df5=df.assign(id=(df['F_name']+''''.'+df['L_name'])。astype('category')。cat.code) 上面的代码不起作用,这只是我的尝试。 此表使用p_id链接到数据库中的其他表,我需要合并或联
对于df[p_id']中的ind,val。iteritems():
如果df['dup_id']中的val:
df5=df.assign(id=(df['F_name']+''''.'+df['L_name'])。astype('category')。cat.code)
上面的代码不起作用,这只是我的尝试。
此表使用p_id链接到数据库中的其他表,我需要合并或联接它们
uid(新id)和将用于对记录进行分组。我会按fname和lname对它们进行分组,但由于名称条目不一致,我决定使用更可靠的dup_id和p_id
新产量
P_id F_name L_name DOB dup_id
25 John Doe 23/1/90 29
28 John Doe 23/1/90 29
29 John Doe 23/1/90 0
35 Jane Dawson 20/1/68 0
47 Jane Matilda Dawson 20/1/68 35
120 Shane Jack 12/1/97 0
50 Belinda Ada 11/11/11 145
145 Belynda Ada 11/11/11 0
65 Shayne M. Jack 12/1/97 120
你能为你的输入数据帧显示()你想要的输出吗?@jpp谢谢我刚才做了。你不能在dup_id==0时用P_id替换dup_id,然后按它分组吗?@HaleemurAli好的,非常感谢。。。我不是那样看的。。成功了。
P_id F_name L_name DOB dup_id uid
25 John Doe 23/1/90 29 1
28 John Doe 23/1/90 29 1
29 John Doe 23/1/90 0 1
35 Jane Dawson 20/1/68 0 2
47 Jane Matilda Dawson 20/1/68 35 2
120 Shane Jack 12/1/97 0 3
65 Shayne M. Jack 12/1/97 120 3
50 Belinda Ada 11/11/11 145 4
145 Belynda Ada 11/11/11 0 4