Python 使用列表从嵌套JSON复制数据帧
虽然可以找到其他几个嵌套JSON到dataframe的示例,但我找不到这个示例,因此没有成功。我有一个嵌套的JSON,如下所示:Python 使用列表从嵌套JSON复制数据帧,python,json,pandas,Python,Json,Pandas,虽然可以找到其他几个嵌套JSON到dataframe的示例,但我找不到这个示例,因此没有成功。我有一个嵌套的JSON,如下所示: {'x': {'1':[2,5,6],'2':[7,6]}, 'y': {'1':[0,4,8],'2':[8,1]}, 'z': {'1':[8,0,9],'2':[2,2]}} 我想要一个数据帧,如下所示: 1_0 1_1 1_2 2_0 2_1 x 2 5 6 7 6 y 0 4 8
{'x':
{'1':[2,5,6],'2':[7,6]},
'y':
{'1':[0,4,8],'2':[8,1]},
'z':
{'1':[8,0,9],'2':[2,2]}}
我想要一个数据帧,如下所示:
1_0 1_1 1_2 2_0 2_1
x 2 5 6 7 6
y 0 4 8 8 1
z 8 0 9 2 2
只要我能正确地推断数据,列的标签不一定就是这样
我试过这个:
import json
import pandas as pd
from pandas.io.json import json_normalize
with gzip.open('example.json') as f:
d = json.load(f)
df = pd.json_normalize(d)
df
因此:
一种方法是首先使用
数据帧。从_dict
以列表的形式加载值,然后将其合并:
d = {'x':
{'1':[2,5,6],'2':[7,6]},
'y':
{'1':[0,4,8],'2':[8,1]},
'z':
{'1':[8,0,9],'2':[2,2]}}
df = pd.DataFrame.from_dict(d, orient="index")
df2 = pd.concat([pd.DataFrame(df[i].values.tolist(),
columns=[f"{i}_{num}" for num in range(len(df[i].iat[0]))]
) for i in df.columns],axis=1)
print (df2)
1_0 1_1 1_2 2_0 2_1
0 2 5 6 7 6
1 0 4 8 8 1
2 8 0 9 2 2
或者使用chain.from_iterable
首先展平列表:
from itertools import chain
print (pd.DataFrame([chain.from_iterable(i.values()) for i in d.values()],
index=d.keys(),
columns=[f"{k}_{num}" for k, v in list(d.values())[0].items()
for num in range(len(v))]))
1_0 1_1 1_2 2_0 2_1
x 2 5 6 7 6
y 0 4 8 8 1
z 8 0 9 2 2
谢谢你的回答,这当然有效,但我正在寻找一种高度优化的方法,因为我真正的JSON文件>200MB@当然可以。我为您添加了另一种测试方法。@HenryYik-列名称为different@jezrael是的,但他也说,这些列的标签不一定必须是这样:)@HenryYik是的,但如果你有一个简单的方法来实现它,它会是首选。很高兴在第二个选项中也有行标签!