drop_duplicates()已停止在Python中工作
这段代码以前在Python3中用于删除重复值,但在整个数据帧中保留第一次出现。回到我的脚本后,这将不再删除数据帧中的重复项drop_duplicates()已停止在Python中工作,python,pandas,duplicates,drop-duplicates,Python,Pandas,Duplicates,Drop Duplicates,这段代码以前在Python3中用于删除重复值,但在整个数据帧中保留第一次出现。回到我的脚本后,这将不再删除数据帧中的重复项 df = df.apply(lambda x: x.drop_duplicates(), axis=1) 所以如果我有 a b c 0 1 2 3 4 0 0 8 9 10 0 11 我想把它作为输出 a b c 0 1 2 3 4 8 9 10 11 我不介意空格是否返回为“nan” 我还尝试了以下方法 df.d
df = df.apply(lambda x: x.drop_duplicates(), axis=1)
所以如果我有
a b c
0 1 2
3 4 0
0 8 9
10 0 11
我想把它作为输出
a b c
0 1 2
3 4
8 9
10 11
我不介意空格是否返回为“nan”
我还尝试了以下方法
df.drop_duplicates(subset = None, keep='first')
及
欢迎提供任何建议/备选方案 您需要
就地才能为真:
df.drop_duplicates(subset=None, keep='first', inplace=True)
在您附上数据后,我想您可以使用复制的
newdf=df[~df.stack().duplicated().unstack()]
newdf
Out[131]:
a b c
0 0.0 1.0 2.0
1 3.0 4.0 NaN
2 NaN 8.0 9.0
3 10.0 NaN 11.0
啊,是的,我也尝试过更新该帧-第一次遍历行或列-这对转换为int64的数据非常有效-谢谢!
newdf=df[~df.stack().duplicated().unstack()]
newdf
Out[131]:
a b c
0 0.0 1.0 2.0
1 3.0 4.0 NaN
2 NaN 8.0 9.0
3 10.0 NaN 11.0