Python 根据一列中值的条件,一次覆盖多列中的值
我有这样的数据框架:Python 根据一列中值的条件,一次覆盖多列中的值,python,pandas,apply,Python,Pandas,Apply,我有这样的数据框架: df = pd.DataFrame(data={ 'col0': [11, 22,1, 5] 'col1': ['aa:a:aaa', 'a:a', 'a', 'a:aa:a:aaa'], 'col2': ["foo", "foo", "foobar", "bar"], 'col3': [True, False, True, False], 'col4': ['elo', 'foo', 'bar', 'dupa']}) 我想在拆分后
df = pd.DataFrame(data={
'col0': [11, 22,1, 5]
'col1': ['aa:a:aaa', 'a:a', 'a', 'a:aa:a:aaa'],
'col2': ["foo", "foo", "foobar", "bar"],
'col3': [True, False, True, False],
'col4': ['elo', 'foo', 'bar', 'dupa']})
我想在拆分后获得列表的长度“:“在col1中,如果长度>2,我想覆盖值,如果长度则不覆盖值,在拆分后确定列表的长度,然后您可以比较并使用.loc[]
,在条件匹配的地方分配列表:
df.loc[df['col1'].str.split(":").str.len()>2,['col1','col2','col3']]=["", "", False]
print(df)
使用、添加
1
、比较列表并将列表分配给列表中的筛选列:
df.loc[df['col1'].str.count(":").add(1).gt(2), ['col1','col2','col3']] = ["", "", False]
print (df)
col0 col1 col2 col3 col4
0 11 False elo
1 22 a:a foo False foo
2 1 a foobar True bar
3 5 False dupa
另一种方法是使用expand=True和axis=1
df.loc[df['col1'].str.split(":",expand = True).count(axis=1).gt(2),['col1','col2','col3']]=["", "", False]
print(df)
col0 col1 col2 col3 col4
0 11 False elo
1 22 a:a foo False foo
2 1 a foobar True bar
3 5 False dupa
该情况是否在
col2
或col1
上?我为这个错误道歉。它是col1。这是最好的答案,因为它不存储临时拆分,但是为什么不使用gt(1)
而不是添加1和gt(2)
?@anishtain4-yop,同意吗
df.loc[df['col1'].str.count(":").add(1).gt(2), ['col1','col2','col3']] = ["", "", False]
print (df)
col0 col1 col2 col3 col4
0 11 False elo
1 22 a:a foo False foo
2 1 a foobar True bar
3 5 False dupa
df.loc[df['col1'].str.split(":",expand = True).count(axis=1).gt(2),['col1','col2','col3']]=["", "", False]
print(df)
col0 col1 col2 col3 col4
0 11 False elo
1 22 a:a foo False foo
2 1 a foobar True bar
3 5 False dupa