Python 选择值分配不明确的数据帧行
我在识别不明确的变量匹配时遇到问题。我正在浏览一个数据库,希望找到在整个观察期内标识符发生变化的公司。我还有另一个永久标识符 如果表格如下所示:Python 选择值分配不明确的数据帧行,python,pandas,dataframe,Python,Pandas,Dataframe,我在识别不明确的变量匹配时遇到问题。我正在浏览一个数据库,希望找到在整个观察期内标识符发生变化的公司。我还有另一个永久标识符 如果表格如下所示: ID1 ID2 1111 1 1111 1 1111 1 1112 1 1112 1 1112 1 4444 2 4444 2 4444 2 我想得到一个类似以下内容的简单输出: ID1 ID2 1111 1 1112 1 非常感谢 您需要首先识别具有超过1个ID1的ID2s(使用transform('nunique
ID1 ID2
1111 1
1111 1
1111 1
1112 1
1112 1
1112 1
4444 2
4444 2
4444 2
我想得到一个类似以下内容的简单输出:
ID1 ID2
1111 1
1112 1
非常感谢 您需要首先识别具有超过1个ID1的
ID2
s(使用transform('nunique')
),然后删除重复项
df[df.groupby('ID2').ID1.transform('nunique').gt(1)].drop_duplicates()
# ID1 ID2
#0 1111 1
#3 1112 1
您需要首先识别具有超过1个ID1的
ID2
s(使用transform('nunique')
),然后删除重复项
df[df.groupby('ID2').ID1.transform('nunique').gt(1)].drop_duplicates()
# ID1 ID2
#0 1111 1
#3 1112 1
在:
输出:
在:
输出:
| | ID1 | ID2 |
|---|------|-----|
| 0 | 1111 | 1 |
| 3 | 1112 | 1 |