Python 使用Pandas在位置上拆分字符串
我有一个功能(Item_Identifier),其中包含有关产品的信息。它看起来像这样:Python 使用Pandas在位置上拆分字符串,python,pandas,Python,Pandas,我有一个功能(Item_Identifier),其中包含有关产品的信息。它看起来像这样: 0 FDA15 1 DRC01 2 FDN15 3 FDX07 4 NCD19 我试图将特征分成三部分,第一部分应该包含两个字符,第二部分包含第三个字符,最后一部分应该包含数值。我尝试过使用pandasstr.split()方法,但无法在特定位置执行拆分。这是我尝试过的,但我无法根据位置执行拆分 train.Item_Identifier.str.split('',expan
0 FDA15
1 DRC01
2 FDN15
3 FDX07
4 NCD19
我试图将特征分成三部分,第一部分应该包含两个字符,第二部分包含第三个字符,最后一部分应该包含数值。我尝试过使用pandasstr.split()
方法,但无法在特定位置执行拆分。这是我尝试过的,但我无法根据位置执行拆分
train.Item_Identifier.str.split('',expand=True)
0 1 2 3 4 5 6
0 F D A 1 5
1 D R C 0 1
2 F D N 1 5
3 F D X 0 7
4 N C D 1 9
是否有一种方法可以使用str.split()方法执行此操作,如果没有,我还可以尝试其他方法。对于您的示例数据:
df.item_identifier.str.extract('(\w{2})(\w)(\d+)')
输出:
0 1 2
0 FD A 15
1 DR C 01
2 FD N 15
3 FD X 07
4 NC D 19
对于您的示例数据:
df.item_identifier.str.extract('(\w{2})(\w)(\d+)')
输出:
0 1 2
0 FD A 15
1 DR C 01
2 FD N 15
3 FD X 07
4 NC D 19
每个值都将采用给定格式(3个字符和一个2位字符串)?每个值都将采用给定格式(3个字符和一个2位字符串)?