Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/330.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用列表从嵌套JSON复制数据帧_Python_Json_Pandas - Fatal编程技术网

Python 使用列表从嵌套JSON复制数据帧

Python 使用列表从嵌套JSON复制数据帧,python,json,pandas,Python,Json,Pandas,虽然可以找到其他几个嵌套JSON到dataframe的示例,但我找不到这个示例,因此没有成功。我有一个嵌套的JSON,如下所示: {'x': {'1':[2,5,6],'2':[7,6]}, 'y': {'1':[0,4,8],'2':[8,1]}, 'z': {'1':[8,0,9],'2':[2,2]}} 我想要一个数据帧,如下所示: 1_0 1_1 1_2 2_0 2_1 x 2 5 6 7 6 y 0 4 8

虽然可以找到其他几个嵌套JSON到dataframe的示例,但我找不到这个示例,因此没有成功。我有一个嵌套的JSON,如下所示:

{'x':
     {'1':[2,5,6],'2':[7,6]},
 'y':
     {'1':[0,4,8],'2':[8,1]},
 'z':
     {'1':[8,0,9],'2':[2,2]}}
我想要一个数据帧,如下所示:

   1_0 1_1 1_2 2_0 2_1
x   2   5   6   7   6
y   0   4   8   8   1
z   8   0   9   2   2
只要我能正确地推断数据,列的标签不一定就是这样

我试过这个:

import json
import pandas as pd
from pandas.io.json import json_normalize

with gzip.open('example.json') as f:    
    d = json.load(f)  

df = pd.json_normalize(d)
df  
因此:


一种方法是首先使用
数据帧。从_dict
以列表的形式加载值,然后将其合并:

d = {'x':
     {'1':[2,5,6],'2':[7,6]},
 'y':
     {'1':[0,4,8],'2':[8,1]},
 'z':
     {'1':[8,0,9],'2':[2,2]}}

df = pd.DataFrame.from_dict(d, orient="index")
df2 = pd.concat([pd.DataFrame(df[i].values.tolist(),
                              columns=[f"{i}_{num}" for num in range(len(df[i].iat[0]))]
                              ) for i in df.columns],axis=1)

print (df2)

   1_0  1_1  1_2  2_0  2_1
0    2    5    6    7    6
1    0    4    8    8    1
2    8    0    9    2    2
或者使用
chain.from_iterable
首先展平列表:

from itertools import chain

print (pd.DataFrame([chain.from_iterable(i.values()) for i in d.values()],
                    index=d.keys(),
                    columns=[f"{k}_{num}" for k, v in list(d.values())[0].items()
                             for num in range(len(v))]))

   1_0  1_1  1_2  2_0  2_1
x    2    5    6    7    6
y    0    4    8    8    1
z    8    0    9    2    2

谢谢你的回答,这当然有效,但我正在寻找一种高度优化的方法,因为我真正的JSON文件>200MB@当然可以。我为您添加了另一种测试方法。@HenryYik-列名称为different@jezrael是的,但他也说,这些列的标签不一定必须是这样:)@HenryYik是的,但如果你有一个简单的方法来实现它,它会是首选。很高兴在第二个选项中也有行标签!