Python 然后按ID分组查找';H';所有行的风险列中的字符
我有一个数据帧df示例:Python 然后按ID分组查找';H';所有行的风险列中的字符,python,pandas,pandas-groupby,Python,Pandas,Pandas Groupby,我有一个数据帧df示例: ID risk 1111 H 1111 H 1111 L 1111 L 1112 L 1112 L 1113 H 1113 L 1113 H 1113 H 1113 H 1114 L 1114 L 1114 L 1114 L 我想根据ID对数据进行分组,然后在“风险”列中查找出现的“H”字符。如果在特定ID的任何行的风险列中存在任何“H”,我想将风险列中该特定ID的所有行更改为“H”。这就是我想要的: ID risk 1111
ID risk
1111 H
1111 H
1111 L
1111 L
1112 L
1112 L
1113 H
1113 L
1113 H
1113 H
1113 H
1114 L
1114 L
1114 L
1114 L
我想根据ID对数据进行分组,然后在“风险”列中查找出现的“H”字符。如果在特定ID的任何行的风险列中存在任何“H”,我想将风险列中该特定ID的所有行更改为“H”。这就是我想要的:
ID risk
1111 H
1111 H
1111 H
1111 H
1112 L
1112 L
1113 H
1113 H
1113 H
1113 H
1113 H
1114 L
1114 L
1114 L
1114 L
我有一个非常大的数据框架,所以我如何才能有效地做到这一点 首先查找所有唯一的
ID
by,然后将值替换为或loc
和:
另一个解决方案:
df.loc[df['ID'].isin(df.loc[df['risk'] == 'H', 'ID'].unique()), 'risk'] = 'H'
使用groupby
的最慢解决方案:
m = df.groupby('ID')['risk'].transform(lambda x: (x == 'H').any())
#better groupby alternative
#m = df['risk'].eq('H').groupby(df['ID']).transform('any')
df['risk'] = np.where(m, 'H', df['risk'])
谢谢,这个很好用。我尝试了你的第二个解决方案(一行),效果很好。谢谢
m = df.groupby('ID')['risk'].transform(lambda x: (x == 'H').any())
#better groupby alternative
#m = df['risk'].eq('H').groupby(df['ID']).transform('any')
df['risk'] = np.where(m, 'H', df['risk'])
print (df)
ID risk
0 1111 H
1 1111 H
2 1111 H
3 1111 H
4 1112 L
5 1112 L
6 1113 H
7 1113 H
8 1113 H
9 1113 H
10 1113 H
11 1114 L
12 1114 L
13 1114 L
14 1114 L