在Python中保留除一列之外的重复行
以下是一个示例数据集: 我想用同一个id用户提交的关于同一栋房子(相同的“sq”和“pool”值)的意见组成一个小组。和一组来自同一家但身份不同的用户 我设法用同一个注释id团队在第三个注释行中执行第一个场景 在第四排,我试图再次找到关于同一栋房子的意见书,但来自不同的id。不幸的是,这一行中的代码是不正确的,但我认为将重复项与“and”语句结合起来,然后找到具有不同id的重复项的想法会得到想要的结果。你能帮忙吗 额外解释: 如果在下面打印df,则: -第一行和第三行属于第一个场景(相同的房子,相同的id用户) -第二个和第四个属于第二个场景(相同的房子,不同的id用户) 代码: IIUC,你需要:在Python中保留除一列之外的重复行,python,pandas,Python,Pandas,以下是一个示例数据集: 我想用同一个id用户提交的关于同一栋房子(相同的“sq”和“pool”值)的意见组成一个小组。和一组来自同一家但身份不同的用户 我设法用同一个注释id团队在第三个注释行中执行第一个场景 在第四排,我试图再次找到关于同一栋房子的意见书,但来自不同的id。不幸的是,这一行中的代码是不正确的,但我认为将重复项与“and”语句结合起来,然后找到具有不同id的重复项的想法会得到想要的结果。你能帮忙吗 额外解释: 如果在下面打印df,则: -第一行和第三行属于第一个场景(相同的房子,
df[df.duplicated(['sq','pool'],keep=False)&~df.id.duplicated(keep=False)]
IIUC,你需要:
df[df.duplicated(['sq','pool'],keep=False)&~df.id.duplicated(keep=False)]
我可以把它倒过来吗,意思是对于同一个id,应该有不同的记录。我没有不同的记录,但希望从中创建scratch@Haseeb你的意思是
df.drop_duplicates(['id','pool'])
?若并没有,可以发布一个带有输入和预期输出的问题。我或其他发明者将能够提供帮助。我可以将其反转,这意味着对于相同的id,应该有不同的记录。我没有不同的记录,但希望从中创建scratch@Haseeb你的意思是df.drop_duplicates(['id','pool'])
?若并没有,可以发布一个带有输入和预期输出的问题。我或其他发明者将能够提供帮助。
id sq pool
1 2 4 no
3 90 4 no