Python 3.x 按组和该组中的列删除重复项
我试图删除每个组中的重复项,似乎很直截了当,因为我在处理组系列时遇到了问题。考虑到这些数据:Python 3.x 按组和该组中的列删除重复项,python-3.x,pandas,Python 3.x,Pandas,我试图删除每个组中的重复项,似乎很直截了当,因为我在处理组系列时遇到了问题。考虑到这些数据: import pandas as pd data = { 'Keyword': ['car', 'car', 'car', 'bus', 'bus','bus'], 'Colour': ['blue','blue','red','blue','yellow','yellow'] } df = pd.DataFrame(data=data) print(df) 我得到这个输出 Ke
import pandas as pd
data = {
'Keyword': ['car', 'car', 'car', 'bus', 'bus','bus'],
'Colour': ['blue','blue','red','blue','yellow','yellow']
}
df = pd.DataFrame(data=data)
print(df)
我得到这个输出
Keyword Colour
0 car blue
1 car blue
2 car red
3 bus blue
4 bus yellow
5 bus yellow
我正试着去
Keyword Colour
0 car blue
1 car red
2 bus blue
3 bus yellow
我已经试过了,但现在还没有开始做这个系列
test = df.groupby(['Keyword', 'Colour']).size().drop_duplicates('Colour', keep='first')
df.drop_duplicates(['Keyword','color'])
?@QuangHoang,我真不敢相信这么简单,非常感谢