Python 如何在DataFrame.drop_duplicates()调用中获取删除的重复项列表?
我有一个Python数据框架,其中包含一些重复项 有没有一种简单(惯用)的方法来获取副本列表 我知道关于Python 如何在DataFrame.drop_duplicates()调用中获取删除的重复项列表?,python,pandas,Python,Pandas,我有一个Python数据框架,其中包含一些重复项 有没有一种简单(惯用)的方法来获取副本列表 我知道关于drop\u duplicates()的内容,但它似乎没有返回被删除的内容 我可以通过使用散列映射来计算出现次数来开发一些东西,但我希望避免使用大量执行内置功能的自定义函数使代码膨胀。获取重复列表的一种方法是使用“duplicated”函数。它返回一个布尔值列表,指示元素是否重复 一个例子: from io import StringIO import pandas as pd txt1
drop\u duplicates()
的内容,但它似乎没有返回被删除的内容
我可以通过使用散列映射来计算出现次数来开发一些东西,但我希望避免使用大量执行内置功能的自定义函数使代码膨胀。获取重复列表的一种方法是使用“duplicated”函数。它返回一个布尔值列表,指示元素是否重复 一个例子:
from io import StringIO
import pandas as pd
txt1 = StringIO("""card
Amex
Visa
Amex""")
monthly_df = pd.read_csv(txt1)
print(monthly_df.duplicated())
print(monthly_df[monthly_df.duplicated()])
此代码的输出为:
0 False
1 False
2 True
dtype: bool
card
2 Amex
因此,我认为您正在寻找的代码如下:
monthly_df[monthly_df.duplicated()]
可能已经回答了