Python 如何使用pandas数据帧分解多个colulms_Python_Pandas_Dataframe_Explode

Python 如何使用pandas数据帧分解多个colulms

python pandas dataframe

Python 如何使用pandas数据帧分解多个colulms,python,pandas,dataframe,explode,Python,Pandas,Dataframe,Explode,df=spark.sql（“从表中选择键、名称、主题”） df在上面的select语句中： key name subjects 12 x,y,z 1,2,3 20 a,b 8,7 df输出： 12 x 1 12 y 2 12 z 3 20 a 8 20 b 7 尝试转换为列表、分解。仍然抛出错误。请帮助找到实现此目标的有效方法？单向使用pandas.DataFrame.apply： # df["name"] = df["name&

df=spark.sql（“从表中选择键、名称、主题”）

df在上面的select语句中：

key name    subjects
12  x,y,z   1,2,3
20  a,b     8,7

df输出：

尝试转换为列表、分解。仍然抛出错误。请帮助找到实现此目标的有效方法？

单向使用

pandas.DataFrame.apply

：

# df["name"] = df["name"].str.split(",")
# df["subjects"] = df["subjects"].str.split(",")
# If not already split

new_df = df.apply(pd.Series.explode)
print(new_df)

输出：

   key name subjects
0   12    x        1
0   12    y        2
0   12    z        3
1   20    a        8
1   20    b        7

单向使用pandas.DataFrame.apply：

# df["name"] = df["name"].str.split(",")
# df["subjects"] = df["subjects"].str.split(",")
# If not already split

new_df = df.apply(pd.Series.explode)
print(new_df)

输出：

   key name subjects
0   12    x        1
0   12    y        2
0   12    z        3
1   20    a        8
1   20    b        7

谢谢你，克里斯。它正在爆炸。仍然面临错误-无法从重复轴重新编制索引。带忽略索引的Concat不起作用。是否可以生成临时唯一索引，因为在分解期间复制了键。pandasversion-1.0.5

df["name"] = df["name"].str.split(",") 
df["subjects"] = df["subjects"].str.split(",") 
new_df= df.apply(pd.Series.explode).reindex()

df["name"] = df["name"].str.split(",") 
df["subjects"] = df["subjects"].str.split(",") 
new_df= df.apply(pd.Series.explode).reindex()

与…有关。