Python 如何处理熊猫中相互补充的重复数据?
我正在使用pandas,我正在尝试删除所有具有object类型的重复项。但是,我面临的问题是,一些重复的数据相互补充。例如,具有以下数据帧:Python 如何处理熊猫中相互补充的重复数据?,python,pandas,Python,Pandas,我正在使用pandas,我正在尝试删除所有具有object类型的重复项。但是,我面临的问题是,一些重复的数据相互补充。例如,具有以下数据帧: print (df) name ID location 0 A NaN LA 1 A 30 NaN 2 B NaN NaN 3 B NaN NY 4 B 20 NY 5 D 15 TX 6 D 15
print (df)
name ID location
0 A NaN LA
1 A 30 NaN
2 B NaN NaN
3 B NaN NY
4 B 20 NY
5 D 15 TX
6 D 15 NaN
正如您所看到的,它们中的大多数是必需的,但同时也被认为是重复的。面对这种情况,我如何解决这个问题
我需要的结果如下:
print (df)
name ID location
0 A 30 LA
1 B 20 NY
2 D 15 TX
您可以尝试:
df.groupby('name').first(dropna=True)
它返回:
name ID location
A 30.0 LA
B 20.0 NY
D 15.0 TX
下面应该有用
df1 = df.groupby(['Name'],as_index=False).first()
你能澄清你的问题吗?很难说出你想要的结果是什么。很抱歉给你带来困惑。我已经编辑了问题并添加了期望的结果。我没有得到这个错误,我不知道它是如何产生的。您的实际df看起来如何?尽管您可以尝试使用“skipna=True”。