Python 选择值分配不明确的数据帧行

Python 选择值分配不明确的数据帧行,python,pandas,dataframe,Python,Pandas,Dataframe,我在识别不明确的变量匹配时遇到问题。我正在浏览一个数据库,希望找到在整个观察期内标识符发生变化的公司。我还有另一个永久标识符 如果表格如下所示: ID1 ID2 1111 1 1111 1 1111 1 1112 1 1112 1 1112 1 4444 2 4444 2 4444 2 我想得到一个类似以下内容的简单输出: ID1 ID2 1111 1 1112 1 非常感谢 您需要首先识别具有超过1个ID1的ID2s(使用transform('nunique

我在识别不明确的变量匹配时遇到问题。我正在浏览一个数据库,希望找到在整个观察期内标识符发生变化的公司。我还有另一个永久标识符

如果表格如下所示:

ID1  ID2

1111  1
1111  1
1111  1
1112  1
1112  1
1112  1
4444  2
4444  2
4444  2
我想得到一个类似以下内容的简单输出:

ID1   ID2

1111  1
1112  1

非常感谢

您需要首先识别具有超过1个ID1的
ID2
s(使用
transform('nunique')
),然后删除重复项

df[df.groupby('ID2').ID1.transform('nunique').gt(1)].drop_duplicates()
#    ID1  ID2
#0  1111    1
#3  1112    1

您需要首先识别具有超过1个ID1的
ID2
s(使用
transform('nunique')
),然后删除重复项

df[df.groupby('ID2').ID1.transform('nunique').gt(1)].drop_duplicates()
#    ID1  ID2
#0  1111    1
#3  1112    1
在:

输出:

在:

输出:

|   | ID1  | ID2 |
|---|------|-----|
| 0 | 1111 | 1   |
| 3 | 1112 | 1   |