Pandas 如何在dataframe的列中使用字符串列表

Pandas 如何在dataframe的列中使用字符串列表,pandas,dataframe,Pandas,Dataframe,我有一个pandas数据框,其中包括一个功能,在这里命名为B,它有一个值列表: df 规范化此数据帧中的功能B以构建模型的好方法是什么?您可以这样做: df = df.apply(lambda x: x.str.split(',').explode()) print(df) A B 0 t8 ab1r 0 t8 tvc3b 0 t8 cdv5s 0 t8 tad7 1 t9 trg1br 2 t2 trg6b 2 t2 t9try

我有一个pandas数据框,其中包括一个功能,在这里命名为B,它有一个值列表:

df

规范化此数据帧中的功能B以构建模型的好方法是什么?

您可以这样做:

df = df.apply(lambda x: x.str.split(',').explode())
print(df)

    A       B
0  t8    ab1r
0  t8   tvc3b
0  t8   cdv5s
0  t8    tad7
1  t9  trg1br
2  t2   trg6b
2  t2   t9try
2  t2    ab1r
2  t2    t8sf
2  t2   t10hg
3  t2   t20hj
3  t2   tad7'

您期望的输出是什么?对B对应行中的所有字符串重复特性A的每一行似乎是一个好的输出。例如,第一行将更改为四行,即(t8 ab1r)(t8 tvc3b)(t8 cdv5s)(t8 tad7)。这就是我需要的!我是熊猫的初学者!很高兴这起作用了。您还可以在末尾使用
.reset_index()
重置索引值
df = df.apply(lambda x: x.str.split(',').explode())
print(df)

    A       B
0  t8    ab1r
0  t8   tvc3b
0  t8   cdv5s
0  t8    tad7
1  t9  trg1br
2  t2   trg6b
2  t2   t9try
2  t2    ab1r
2  t2    t8sf
2  t2   t10hg
3  t2   t20hj
3  t2   tad7'