Python 从文件中删除冗余时出现问题

Python 从文件中删除冗余时出现问题,python,pandas,file,duplicates,Python,Pandas,File,Duplicates,我有一个数据集,有两列,一列有分类值(State2),另一列(State)只包含二进制的相同值。 我使用了OneHotEncoding import pandas as pd mydataset = pd.read_csv('fieldprotobackup.binetflow') mydataset.drop_duplicates(['Proto2','Proto'], keep='first') mydataset.to_csv('fieldprotobackup.binetflow',

我有一个数据集,有两列,一列有分类值(
State2
),另一列(
State
)只包含二进制的相同值。
我使用了
OneHotEncoding

import pandas as pd

mydataset = pd.read_csv('fieldprotobackup.binetflow')

mydataset.drop_duplicates(['Proto2','Proto'], keep='first')
mydataset.to_csv('fieldprotobackup.binetflow', columns=['Proto2','Proto'], index=False)


我想删除文件中的所有冗余内容。在研究过程中,我发现df.drop\u命令重复,但它对我不起作用。

您需要添加
inplace=True
参数,或者需要捕获返回的数据帧:

mydataset.drop_duplicates(['Proto2','Proto'], keep='first', inplace=True)


当某些内容无法按预期工作时,检查始终是一个好主意。

您需要添加
inplace=True
参数,或者需要捕获返回的数据帧:

mydataset.drop_duplicates(['Proto2','Proto'], keep='first', inplace=True)


当某些内容无法按预期工作时,检查始终是一个好主意。

正如下面的解决方案所述,您没有保存重复的拖放结果。正如下面的解决方案所述,您没有保存重复的拖放结果。非常感谢!它现在可以工作了,但当我运行程序时,它只会删除剩下的0。您应该发布另一个问题,但是您的问题看起来像是将二进制数视为整数,这就是前导零被截断的原因。同时,接受回答这个问题的答案。对不起。我是新来的,非常感谢!它现在可以工作了,但当我运行程序时,它只会删除剩下的0。您应该发布另一个问题,但是您的问题看起来像是将二进制数视为整数,这就是前导零被截断的原因。同时,接受回答这个问题的答案。对不起。我是这个论坛的新手。