Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/288.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 对子数据帧重复数据帧行_Python_Pandas_Dataframe - Fatal编程技术网

Python 对子数据帧重复数据帧行

Python 对子数据帧重复数据帧行,python,pandas,dataframe,Python,Pandas,Dataframe,源代码是一个带有嵌套字典的JSON文件 我创建了一个顶级defaultdict(dict)和一个for循环,以获取第1行到第7行、列状态、大小和Pop的数据帧 在上面的for循环中,我再次创建了另一个(子)defaultdict(dict)和for循环,以获取第1行到第2行、列City、Size、Pop的数据帧 我将子项defaultdict(dict)附加到最上面的defaultdict(dict)之后 父数据帧中的行应针对子数据帧重复 期望输出 State Size Pop

源代码是一个带有嵌套字典的JSON文件

我创建了一个顶级defaultdict(dict)和一个for循环,以获取第1行到第7行、列状态、大小和Pop的数据帧

在上面的for循环中,我再次创建了另一个(子)defaultdict(dict)和for循环,以获取第1行到第2行、列City、Size、Pop的数据帧

我将子项defaultdict(dict)附加到最上面的defaultdict(dict)之后

父数据帧中的行应针对子数据帧重复

期望输出

    State   Size    Pop   City      Size    Pop
1    MH     120     300    MU        100    150
2    MH     120     300    PU        80     110
3    MH     120     300    NG        75     120
4    MH     120     300    PC        85     110
5    GJ     110     250    SU        70     100
6    GJ     110     250    VA        75     80
7    GJ     110     250    AH        85     120

另一个输入JSON的示例

输入JSON:

{
    "datatop": [
        {
            "datastate": {
                "attributes": {
                    "Name": "ABC",
                    "Place": "123"
                },
                "children": [
                    {
                        "datacity": {
                            "attributes": {
                                "CName": "EFG",
                                "CPlace": "12345"
                            }
                        }
                    },
                    {
                        "datacity": {
                            "attributes": {
                                "CNAME": "HIJ",
                                "CPlace": "6789"
                            }
                        }
                    }
                ]
            }
        },
        {
            "datastate": {
                "attributes": {
                    "Name": "XYZ",
                    "Place": "456"
                },
                "children": [
                    {
                        "datacity": {
                            "attributes": {
                                "CName": "LMN",
                                "CPlace": "1123"
                            }
                        }
                    },
                    {
                        "datacity": {
                            "attributes": {
                                "CName": "OPQ",
                                "CPlace": "22345"
                            }
                        }
                    }
                ]
            }
        }
    ],
    "totalCount": "2"
}
预期产出:

Name    Place   CName   CPlace
ABC     123     EFG     12345
ABC     123     HIJ     6798
XYZ     456     LMN     1123
XYZ     456     OPQ     22345

通过改变我的方法,我能够实现预期的产出

早些时候,我试图对来自子for循环的数据帧行重复父数据帧中的行(我从父for循环获得的行)

新方法: 在父for循环之前创建了一个空列表。 对循环的父循环到子循环的键值对进行了修饰,并创建了一个大字典,其中包括循环的父循环和子循环(嵌套)的键值对。为了生成唯一的键,我使用了循环的父级和子级索引的字符串串联。 一旦for循环的子循环结束,在其外部(在for循环的父循环的末尾),我将字典转换为数据帧并将其附加到列表中。 一旦父for循环完成,列表中就包含完整的数据帧。 最后,我连接了列表中的数据帧

import json
import pandas as pd
from collections import defaultdict

with open("./input.json") as file:
    filedata = json.load(file)

data = filedata['datatop']

dflist = []

for i in range (len(data)):

    attribute = (data[i])['datastate']['attributes']
    child = (((data[i]['datastate'])['children']))

    def_dct_chd = defaultdict(dict)

    # For Loop to Iterate over all the subnets of the L3OUT EPG
    for j in range (len(child)):
        def_dct_chd[str(i)+str(j)]['Name'] = attribute['Name']
        def_dct_chd[str(i)+str(j)]['Place'] = attribute['Place']
        def_dct_chd[str(i)+str(j)]['CName'] = child[j]['datacity']['attributes']['CName']
        def_dct_chd[str(i)+str(j)]['CPlace'] = child[j]['datacity']['attributes']['CPlace']

    # Create the Data Frames out of the dictionary and append it to the list
    dflist.append(pd.DataFrame(def_dct_chd).T)

# concatenate all the dictionaries inside the list
finaldf = pd.concat(dflist)

finaldf = finaldf.reset_index(drop=True)
print(finaldf)

通过改变我的方法,我能够实现预期的产出

早些时候,我试图对来自子for循环的数据帧行重复父数据帧中的行(我从父for循环获得的行)

新方法: 在父for循环之前创建了一个空列表。 对循环的父循环到子循环的键值对进行了修饰,并创建了一个大字典,其中包括循环的父循环和子循环(嵌套)的键值对。为了生成唯一的键,我使用了循环的父级和子级索引的字符串串联。 一旦for循环的子循环结束,在其外部(在for循环的父循环的末尾),我将字典转换为数据帧并将其附加到列表中。 一旦父for循环完成,列表中就包含完整的数据帧。 最后,我连接了列表中的数据帧

import json
import pandas as pd
from collections import defaultdict

with open("./input.json") as file:
    filedata = json.load(file)

data = filedata['datatop']

dflist = []

for i in range (len(data)):

    attribute = (data[i])['datastate']['attributes']
    child = (((data[i]['datastate'])['children']))

    def_dct_chd = defaultdict(dict)

    # For Loop to Iterate over all the subnets of the L3OUT EPG
    for j in range (len(child)):
        def_dct_chd[str(i)+str(j)]['Name'] = attribute['Name']
        def_dct_chd[str(i)+str(j)]['Place'] = attribute['Place']
        def_dct_chd[str(i)+str(j)]['CName'] = child[j]['datacity']['attributes']['CName']
        def_dct_chd[str(i)+str(j)]['CPlace'] = child[j]['datacity']['attributes']['CPlace']

    # Create the Data Frames out of the dictionary and append it to the list
    dflist.append(pd.DataFrame(def_dct_chd).T)

# concatenate all the dictionaries inside the list
finaldf = pd.concat(dflist)

finaldf = finaldf.reset_index(drop=True)
print(finaldf)

请包括示例输入请包括示例输入