Python熊猫：如何仅基于某些列来唯一化我的表？_Python_Pandas_Unique

Python熊猫：如何仅基于某些列来唯一化我的表？

python pandas

Python熊猫：如何仅基于某些列来唯一化我的表？,python,pandas,unique,Python,Pandas,Unique,我有一个df：如何仅基于一列的长度删除重复项？因为我有行，它们的所有列都是相同的，但只有一行不是。我想忽略该列并基于另一列获取唯一值这就是我尝试的方式，但我得到了一个错误： data.drop_duplicates('asn','first_seen','incident_type','ip','uri') 你知道吗？你在运行什么版本的pandas？我认为既然>0.14您应该使用subset关键字为drop_duplicates（）提供一个列列表，所以请尝试 data.drop_dupli

我有一个df：

如何仅基于一列的长度删除重复项？因为我有行，它们的所有列都是相同的，但只有一行不是。我想忽略该列并基于另一列获取唯一值

这就是我尝试的方式，但我得到了一个错误：

data.drop_duplicates('asn','first_seen','incident_type','ip','uri')

你知道吗？

你在运行什么版本的

pandas

？我认为既然

>0.14

您应该使用

subset

关键字为

drop_duplicates（）

提供一个列列表，所以请尝试

data.drop_duplicates（子集=['asn'、'first_seen'、'incident_type'、'ip'、'uri']）

还请注意，如果未使用

inplace=True

，则需要将返回值分配给新的数据帧

根据您的需要，您可能还希望在删除重复行后调用

reset\u index（）