Python 从文件中删除冗余时出现问题_Python_Pandas_File_Duplicates

Python 从文件中删除冗余时出现问题

python pandas file

Python 从文件中删除冗余时出现问题,python,pandas,file,duplicates,Python,Pandas,File,Duplicates,我有一个数据集，有两列，一列有分类值（State2），另一列（State）只包含二进制的相同值。我使用了OneHotEncoding import pandas as pd mydataset = pd.read_csv('fieldprotobackup.binetflow') mydataset.drop_duplicates(['Proto2','Proto'], keep='first') mydataset.to_csv('fieldprotobackup.binetflow',

我有一个数据集，有两列，一列有分类值（

State2

），另一列（

State

）只包含二进制的相同值。
我使用了

OneHotEncoding

import pandas as pd

mydataset = pd.read_csv('fieldprotobackup.binetflow')

mydataset.drop_duplicates(['Proto2','Proto'], keep='first')
mydataset.to_csv('fieldprotobackup.binetflow', columns=['Proto2','Proto'], index=False)

我想删除文件中的所有冗余内容。在研究过程中，我发现df.drop\u命令重复，但它对我不起作用。

您需要添加

inplace=True

参数，或者需要捕获返回的数据帧：

mydataset.drop_duplicates(['Proto2','Proto'], keep='first', inplace=True)

或

当某些内容无法按预期工作时，检查始终是一个好主意。

您需要添加

inplace=True

参数，或者需要捕获返回的数据帧：

mydataset.drop_duplicates(['Proto2','Proto'], keep='first', inplace=True)

或

当某些内容无法按预期工作时，检查始终是一个好主意。

正如下面的解决方案所述，您没有保存重复的拖放结果。正如下面的解决方案所述，您没有保存重复的拖放结果。非常感谢！它现在可以工作了，但当我运行程序时，它只会删除剩下的0。您应该发布另一个问题，但是您的问题看起来像是将二进制数视为整数，这就是前导零被截断的原因。同时，接受回答这个问题的答案。对不起。我是新来的，非常感谢！它现在可以工作了，但当我运行程序时，它只会删除剩下的0。您应该发布另一个问题，但是您的问题看起来像是将二进制数视为整数，这就是前导零被截断的原因。同时，接受回答这个问题的答案。对不起。我是这个论坛的新手。