Pandas 如何在dataframe的列中使用字符串列表
我有一个pandas数据框,其中包括一个功能,在这里命名为B,它有一个值列表: df 规范化此数据帧中的功能B以构建模型的好方法是什么?您可以这样做:Pandas 如何在dataframe的列中使用字符串列表,pandas,dataframe,Pandas,Dataframe,我有一个pandas数据框,其中包括一个功能,在这里命名为B,它有一个值列表: df 规范化此数据帧中的功能B以构建模型的好方法是什么?您可以这样做: df = df.apply(lambda x: x.str.split(',').explode()) print(df) A B 0 t8 ab1r 0 t8 tvc3b 0 t8 cdv5s 0 t8 tad7 1 t9 trg1br 2 t2 trg6b 2 t2 t9try
df = df.apply(lambda x: x.str.split(',').explode())
print(df)
A B
0 t8 ab1r
0 t8 tvc3b
0 t8 cdv5s
0 t8 tad7
1 t9 trg1br
2 t2 trg6b
2 t2 t9try
2 t2 ab1r
2 t2 t8sf
2 t2 t10hg
3 t2 t20hj
3 t2 tad7'
您期望的输出是什么?对B对应行中的所有字符串重复特性A的每一行似乎是一个好的输出。例如,第一行将更改为四行,即(t8 ab1r)(t8 tvc3b)(t8 cdv5s)(t8 tad7)。这就是我需要的!我是熊猫的初学者!很高兴这起作用了。您还可以在末尾使用
.reset_index()
重置索引值
df = df.apply(lambda x: x.str.split(',').explode())
print(df)
A B
0 t8 ab1r
0 t8 tvc3b
0 t8 cdv5s
0 t8 tad7
1 t9 trg1br
2 t2 trg6b
2 t2 t9try
2 t2 ab1r
2 t2 t8sf
2 t2 t10hg
3 t2 t20hj
3 t2 tad7'