Python DataFrame:使用列值对另一列中的字符串进行切片
我有一个熊猫数据框,如下所示:Python DataFrame:使用列值对另一列中的字符串进行切片,python,string,pandas,dataframe,slice,Python,String,Pandas,Dataframe,Slice,我有一个熊猫数据框,如下所示: col1 col2 col3 0 1 3 ABCDEFG 1 1 5 HIJKLMNO 2 1 2 PQRSTUV 我想添加另一列,它应该是col3的子字符串,从col1中指示的位置添加到col2中指示的位置。类似于col3[(col1-1):(col2-1)],这将导致: col1 col2 col3 new_col 0 1 3 AB
col1 col2 col3
0 1 3 ABCDEFG
1 1 5 HIJKLMNO
2 1 2 PQRSTUV
我想添加另一列,它应该是col3
的子字符串,从col1
中指示的位置添加到col2
中指示的位置。类似于col3[(col1-1):(col2-1)]
,这将导致:
col1 col2 col3 new_col
0 1 3 ABCDEFG ABC
1 1 5 HIJKLMNO HIJK
2 1 2 PQRSTUV PQ
我尝试了以下方法:
my_df['new_col'] = my_df.col3.str.slice(my_df['col1']-1, my_df['col2']-1)
及
它们都会导致一列
NaN
,而如果我插入两个数值(即data['col3'].str[1:3]
),则效果很好。我检查了,类型正确(int64、int64和object)。此外,在这样的上下文之外(例如,使用for循环),我可以完成这项工作,但我更喜欢使用利用数据帧的单行程序。我做错了什么?使用apply
,因为每一行都必须单独处理:
my_df['new_col'] = my_df.apply(lambda x: x['col3'][x['col1']-1:x['col2']], 1)
print (my_df)
col1 col2 col3 new_col
0 1 3 ABCDEFG ABC
1 1 5 HIJKLMNO HIJKL
2 1 2 PQRSTUV PQ
很高兴你能帮忙!天气真好!
my_df['new_col'] = my_df.apply(lambda x: x['col3'][x['col1']-1:x['col2']], 1)
print (my_df)
col1 col2 col3 new_col
0 1 3 ABCDEFG ABC
1 1 5 HIJKLMNO HIJKL
2 1 2 PQRSTUV PQ