Python 熊猫:使用条件df[variable]创建新列。变量列表上的isnull
我想创建一个掩码列,其中1表示一组其他列中有数据,0表示同一组中有空白Python 熊猫:使用条件df[variable]创建新列。变量列表上的isnull,python,pandas,Python,Pandas,我想创建一个掩码列,其中1表示一组其他列中有数据,0表示同一组中有空白 A B C D E mask1 0 13 2 45 96 1 1 14 2 45 96 1 2 15 9 1. NaN 1 3 16 9 1.0 NaN 1 4 17 5 0.0 NaN 1 5 18 6 1.0 967 1 6 19 6 1.0 976 1 7 20 9 1.0 294 1 8 21 5
A B C D E mask1
0 13 2 45 96 1
1 14 2 45 96 1
2 15 9 1. NaN 1
3 16 9 1.0 NaN 1
4 17 5 0.0 NaN 1
5 18 6 1.0 967 1
6 19 6 1.0 976 1
7 20 9 1.0 294 1
8 21 5 0.0 372 1
9 13 5 NaN 170 0
10 62 5 NaN 100 0
11 22 20 NaN 170 0
12 13 NaN 0.0 996 0
我使用以下代码成功地做到了这一点:
df2["mask1"] = np.where((df2['C'].isnull() | df2['D'].isnull()) , 0, 1)
现在,我想为具有更多变量的更大数据帧自动执行此操作,也就是说,我想指定用于此掩码的变量。我想创建一个变量列表,比如
var = [C, D, E]
我可以使用它来执行此操作,但不确定如何应用使用此列表时产生的相同代码<代码>用于循环 选择列并应用isnull或notnull
cols = ['C', 'D', 'E']
df['mask1'] = df[cols].notnull().all(1).astype(int)
A B C D E mask1
0 0 13 2.0 45.0 96.0 1
1 1 14 2.0 45.0 96.0 1
2 2 15 9.0 1.0 NaN 0
3 3 16 9.0 1.0 NaN 0
4 4 17 5.0 0.0 NaN 0
5 5 18 6.0 1.0 967.0 1
6 6 19 6.0 1.0 976.0 1
7 7 20 9.0 1.0 294.0 1
8 8 21 5.0 0.0 372.0 1
9 9 13 5.0 NaN 170.0 0
10 10 62 5.0 NaN 100.0 0
11 11 22 20.0 NaN 170.0 0
12 12 13 NaN 0.0 996.0 0
谢谢瓦伊沙利。我不想要所有的列,我只想要我在列表中指定的那些。工作得很好。谢谢!欢迎您:如果问题完全解决了,请考虑接受/投票回答。