Python 查看熊猫中的重复行
我知道如果我在Pandas中有一个DataFrame对象,我可以通过对DataFrame使用.duplicated()方法来确定该行是否是重复的。这将返回一个序列,根据行是否为重复行,给出True或False。我的问题是,是否可以用这个对象对原始数据帧进行索引,这样我只返回重复的数据帧(以便我可以直观地检查它们)?你的意思是像Python 查看熊猫中的重复行,python,pandas,Python,Pandas,我知道如果我在Pandas中有一个DataFrame对象,我可以通过对DataFrame使用.duplicated()方法来确定该行是否是重复的。这将返回一个序列,根据行是否为重复行,给出True或False。我的问题是,是否可以用这个对象对原始数据帧进行索引,这样我只返回重复的数据帧(以便我可以直观地检查它们)?你的意思是像df[df.duplicated()]?@ajcr,是的,这就是我的意思。我在代码中做了一些愚蠢的事情,阻止了这个解决方案的工作。谢谢。我做了一些愚蠢的事情,这种类型的索引
df[df.duplicated()]
?@ajcr,是的,这就是我的意思。我在代码中做了一些愚蠢的事情,阻止了这个解决方案的工作。谢谢。我做了一些愚蠢的事情,这种类型的索引对我不起作用(我的例子稍微复杂一些)。但是谢谢!
In [18]: df = pd.DataFrame(np.random.randint(0, 2, (10, 4)))
In [19]: df
Out[19]:
0 1 2 3
0 0 1 1 0
1 0 1 1 1
2 0 1 1 1
3 1 1 0 0
4 0 1 0 1
5 1 0 1 0
6 0 1 0 1
7 1 1 1 0
8 0 1 1 0
9 0 0 0 1
[10 rows x 4 columns]
In [20]: df[df.duplicated()]
Out[20]:
0 1 2 3
2 0 1 1 1
6 0 1 0 1
8 0 1 1 0
[3 rows x 4 columns]