Python 比较/映射不同数据帧中的不同序列
我有两个数据帧。数据帧“A”是主数据帧,有3列“编号”、“捐赠”和“Var1”。数据帧B有两列“编号”和“位置”。数据框B中的“数字”列是a中“数字”的子集。我想做的是在数据框a中形成一个新列-“新建”,它将映射这两列中的数字值,如果它在数据框B中存在,则会将值添加为1,否则所有其他值都将为0Python 比较/映射不同数据帧中的不同序列,python,pandas,dataframe,Python,Pandas,Dataframe,我有两个数据帧。数据帧“A”是主数据帧,有3列“编号”、“捐赠”和“Var1”。数据帧B有两列“编号”和“位置”。数据框B中的“数字”列是a中“数字”的子集。我想做的是在数据框a中形成一个新列-“新建”,它将映射这两列中的数字值,如果它在数据框B中存在,则会将值添加为1,否则所有其他值都将为0 >>>DFA Number donation Var1 243 4 45 677 56 34 909 34 22 565
>>>DFA
Number donation Var1
243 4 45
677 56 34
909 34 22
565 78 24
568 90 21
784 33 88
787 22 66
>>>DFB
Number location
909 PB
565 WB
784 AU
这是两个数据帧,我希望DFA有一个新的列,看起来像这样
>>>DFA
Number donation Var1 NEW
243 4 45 0
677 56 34 0
909 34 22 1
565 78 24 1
568 90 21 0
784 33 88 1
787 22 66 0
这有一个新列,如果数字存在于DFB中,则该列的值为1,如果不存在,则该列的值为0。您可以使用
isin
方法:
DFA['NEW'] = (DFA['Number'].isin(DFB['Number'])).astype(int)
比如说,
import pandas as pd
DFA = pd.DataFrame({'Number': [243, 677, 909, 565, 568, 784, 787],
'Var1': [45, 34, 22, 24, 21, 88, 66],
'donation': [4, 56, 34, 78, 90, 33, 22]})
DFB = pd.DataFrame({'Number': [909, 565, 784], 'location': ['PB', 'WB', 'AU']})
DFA['NEW'] = (DFA['Number'].isin(DFB['Number'])).astype(int)
print(DFA)
屈服
Number Var1 donation NEW
0 243 45 4 0
1 677 34 56 0
2 909 22 34 1
3 565 24 78 1
4 568 21 90 0
5 784 88 33 1
6 787 66 22 0