Python熊猫:如何仅基于某些列来唯一化我的表?

Python熊猫:如何仅基于某些列来唯一化我的表?,python,pandas,unique,Python,Pandas,Unique,我有一个df: 如何仅基于一列的长度删除重复项?因为我有行,它们的所有列都是相同的,但只有一行不是。我想忽略该列并基于另一列获取唯一值 这就是我尝试的方式,但我得到了一个错误: data.drop_duplicates('asn','first_seen','incident_type','ip','uri') 你知道吗?你在运行什么版本的pandas?我认为既然>0.14您应该使用subset关键字为drop_duplicates()提供一个列列表,所以请尝试 data.drop_dupli

我有一个df:

如何仅基于一列的长度删除重复项?因为我有行,它们的所有列都是相同的,但只有一行不是。我想忽略该列并基于另一列获取唯一值

这就是我尝试的方式,但我得到了一个错误:

data.drop_duplicates('asn','first_seen','incident_type','ip','uri')

你知道吗?

你在运行什么版本的
pandas
?我认为既然
>0.14
您应该使用
subset
关键字为
drop_duplicates()
提供一个列列表,所以请尝试

data.drop_duplicates(子集=['asn'、'first_seen'、'incident_type'、'ip'、'uri'])

还请注意,如果未使用
inplace=True
,则需要将返回值分配给新的数据帧

根据您的需要,您可能还希望在删除重复行后调用
reset\u index()